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Elixir 编 程 入 门 
作者 : straightdave 
来 源 : programming_elixir 


Elixir ，[I'Ikser] ， 意 为 灵丹妙药 、 圣 水 ， 其 logo 是 一 枚 紫色 水 滴 : 


® elixir 


Elixir 是 一 门 建立 在 Erlang 虚 拟 机 上 的 函数 式 的 系统 编程 语言 ， 支 持 元 编程 。 创 始 人 José Valim 

是 ruby 界 的 知名 人 士 。 

私 以 为 ， 可 以 把 Elixir 看 作 部 数 式 的 ruby 语 言 ， 或 者 是 语法 类 似 ruby 的 Erlang。Elixir 受 上 蚁 目的 

原因 ， 是 因为 它 结合 了 Erlang 作 为 系统 编程 语言 的 各 种 优点 ， 以 及 ruby 那 样 简单 易 懂 的 语法 
(Erlangi & ro 4 72 ) 。 


Elixir 还 是 一 门 初出 茅 庐 的 语言 : 
2014 年 8 月 31 日 ，1.0.0 发 布 
2014 年 9 月 1 日 临 蝴 ，1.0.0rc1 发 布 
2014 年 9 月 7 日 晚 ，1.0.0rc2 发 布 
2014 年 9 月 10 日 ，1.0.0 正 式 发 布 
2015 年 9 月 28 日 ，1.1 发 布 

2016 年 1 月 1 日 ，v1.2.0 发 布 


本 文 主要 框架 为 Elixir 官 方 的 入 门 教程 ， 辅 以 网 上 其 它 Elixir 资 源 的 内 容 ， 以 及 花 钱 :sob: 购 买 的 
原版 书籍 (Dave Thomas 的 《Programming Elixir) > Progmatic ) 


请 帮助 更 新 文档 (pr)。 有 问题 请 发 Issue 
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入 门 


1- 简 介 


欢迎 ! 


本 章 是 主要 讲 了 各 个 平台 上 如 何 安装 使 用 Elixir。 由 于 本 文 主要 关注 Elixir 的 语言 学 习 ， 
此 这 个 章节 所 讲 的 步骤 或 工具 可 能 不 是 最 新 ， 请 大 家 自行 网 上 搜索 。 


w 


本 章 将 涵盖 如 何 安装 Elixir， 并 且 学 习 使 用 交互 式 的 Elixir Shell (48 AIEx) 。 
使 用 本 教程 的 需求 : 

e Erlang - version 17.0 或 更 高 

。 Elixir - 1.0.0 或 更 高 
现在 开始 吧 | 


如 果 你 发 现 本 手册 有 错误 ， 请 帮忙 开 jssue 讨 论 或 发 pull request 。 


1.1- 安 装 包 


在 各 个 平台 上 最 方便 的 安装 方式 是 相应 平台 的 安装 包 。 如 果 没 有 ， 推 荐 使 用 precompiled 
package 或 者 用 源码 编译 安装 。 


注意 Elixir 需 要 Erlang 17.0 或 更 高 。 下 面 介 绍 的 方法 基本 上 都 会 自动 为 你 安装 Erlang。 假如 没 
有 ， 请 阅读 下 面 安装 Erlang 的 说 明 。 


Mac OS X 


e Homebrew 
o 升级 Homebrew 到 最 新 
o 执行 : brew install elixir 
e Macports 
o 执行 : sudo port install elixir 


Unix 〈 或 者 类 Unix ) 


e Fedora 17 或 更 新 

o 执行 : yum install elixir 
e Fedora 22 或 更 新 

o 执行 : dnf install elixir 
e Arch Linux (社区 repo) 

o 执行 : pacman -S elixir 


openSUSE (and SLES 11 SP3+) 
o 添加 Erlang devel repo: zypper ar -f obs://devel:languages:erlang/ erlang 


o 执行 : zypper in elixir 


Gentoo 
o 执行 : emerge --ask dev-lang/elixir 
FreeBSD 
o 使 用 ports: cd /usr/ports/lang/elixir && make install clean 
o 或 使 用 pkg: pkg install elixir 
Ubuntu 12.04 和 14.04， 或 Debian 7 
o 添加 Erlang Solutions repo: 


wget https://packages.erlang-solutions.com/erlang-solutions_1.0_all.deb && sudo dl 
o 执行 : sudo apt-get update 
o 安装 Erlang/OTP 平 台 及 相关 程序 : sudo apt-get install esl-erlang 


o 安装 Elixir : sudo apt-get install elixir 


Windows 


e Web installer 

o 下 载 installer 

o 点 下 一 步 ， 下 一 步 ... 直 到 完成 
e Chocolatey 


o cinst elixir 


1.3- 使 用 预 编译 包 


Elixir 为 每 一 个 release 提 供 了 预 编译 包 (编译 好 并 打包 的 程序 ， 开 箱 即 用 ) 。 
首先 安装 Erlang， 然后 在 这 里 下 载 最 新 的 预 编译 包 (Precompiled.zip) 。unzip， 即 可 使 用 
elixir 程 序 和 iex 程 序 了 。 

当然 为 了 方便 起 见 ， 需 要 将 一 些 路 径 加 入 环境 变量 。 


1.4- 从 源码 编译 安装 (Unix 和 MinGW ) 


首先 安装 Erlang， 然后 在 这 里 下 载 最 新 的 源码 ， 自 己 使 用 make 工 具 编译 安装 。 
在 Windows 上 编译 安装 请 参考 https://github.com/elixir-lang/elixir/wiki/Windows 


附 上 加 环境 变量 的 命令 


$ export PATH="$PATH:/path/to/elixir/bin" 


如 果 你 十 分 激进 ， 可 以 直接 选择 编译 安装 github 上 的 master 分 支 : 


$ git clone https://github.com/elixir-lang/elixir.git 
$ cd elixir 
$ make clean test 


如 果 测 试 无 法 通过 ， 可 在 repo 里 开 issue 汇 报 。 


1.5-% X Erlang 


安装 Elixir 唯 一 的 要 求 就 是 Erlang (V17.0+) ， 它 可 以 很 容易 地 使 用 预 编译 包 安 装 。 如 果 你 
想 从 源码 安装 ， 可 以 去 Erlang 网 站 找 找 ， 参 考 Riak 文 档 。 
安装 好 Erlang 后 ， 打 开 命 令 行 (或 命令 窗口 ) ， 输 入 erl ， 可 以 输出 Erlang 的 版 本 信息 : 


Erlang/OTP 17 (erts-6) [64-bit] [smp:2:2] [async-threads:0] [hipe] [kernel-poll:false] 


安装 好 Erlang 后 ， 你 需要 手动 添加 环境 变量 或 $PATH 。 关于 环境 变量 ， 参 考 这 里 。 


1.6- 交 互 模式 


安装 好 Elixir 之 后 ， 你 有 了 三 个 可 执行 文件 : iex ， elixir 和 elixirc ° 如 果 你 是 用 预 编译 
包 方式 安装 的 ， 可 以 在 解压 后 的 bin 目 录 下 找到 它们 。 

现在 我 们 可 以 从 iex 开始 了 (或 者 是 iex.bat ， 如 果 在 Windows 上 ) 。 交互 模式 ， 就 是 可 以 
向 其 中 输入 任何 Elixir 表 达 式 或 命令 ， 然 后 直接 看 到 表达 式 或 命令 的 结果 。 如 以 下 所 示 : 


Interactive Elixir - press Ctrl+C to exit (type h() ENTER for help) 


iex> 40 + 2 

42 

iex> "hello" <> " world" 
"hello world" 


对 这 种 交互 式 命令 行 ， 相 信和 熟悉 ruby，python 等 动态 语言 的 程序 员 一 定 不 会 陌生 。 


如 果 你 用 的 是 Windows， 你 可 以 使 用 iex.bat --werl ， 可 以 根据 你 的 console 获 得 更 好 的 
使 用 体验 。 


1.7- 执 行 脚本 


把 表达 式 写 进 脚本 文件 ， 可 以 用 elixir 命令 执行 它 。 如 : 


$ cat simple.exs 
I0.puts "Hello world 
from Elixir" 


$ elixir simple.exs 


Hello world 
from Elixir 


在 以 后 的 章节 中 ， 我 们 还 会 介绍 如 何 编译 Elixir 程 序 ， 以 及 使 用 Mix 这 样 的 构建 工具 。 


2- 基 本 类 型 


本 章 介绍 Elixir 的 基本 类 型 。Elixir 主 要 的 基本 类 型 有 : 


ZA (integer) > FA (float) ， 布 尔 


(boolean) ， 原 子 (atom， 又 称 symbol 符 号 ) > #4 P (string) ， 列 表 (list) 和 元 组 


(tuple) 等 。 


它们 在 iex 中 显示 如 下 : 


iex> 1 # integer 

iex> Ox1F # integer 

iex> 1.0 # float 

iex> true # boolean 

iex> :atom # atom / symbol 
iex> "elixir" # string 

LEX> [yn 2 ill A TSE 

1ex> {1, 2, 3} # tuple 


2.1- 基 本 算数 运算 


打开 iex ， 输 入 以 下 表达 式 : 


iex> 10 / 2 
5.0 


如 果 你 想 进 行 整 型 除法 ， 或 者 求 余数 > T VALE M HAR div 和 rem ° 


remainder ° Až) 


iex> div(10, 2) 
5 
iex> div 10, 2 
5 
iex> rem 10, 3 


Pe 
a) 


函数 参数 时 ， 括 号 是 可 选 的 。 (ruby 程 序 员 会 


Elixir 支 持 用 捷径 (shortcut ) 


书写 二 进 制 、 入 进 制 、 


， 这 是 预期 的 。 


(rem 的 意思 是 division 


ye 


心 一 笑 ) 


十 六 进 制 整数 。 如 : 
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iex> 0b1010 
10 

1ex> 00777 
511 

iex> 0x1F 
cal 


ZIR’ AHE oo ， 数 字 0+ 人 小 写 0。 


输入 浮 点 型 数字 需要 一 个 小 数 点 ， 且 在 其 后 至 少 有 一 位 数字 。 Elixir 支 持 使 用 e 来 表示 指数 : 


iex> 1.0e-10 
1.0e-10 


Elixir 中 浮 点 型 都 是 64 位 双 精 度 。 


2.2- 布 尔 
Elixir 使 用 true 和 false 两 个 布尔 值 。 


iex> true 

true 

iex> true == false 
false 


Elixir 提 供 了 许多 用 以 判断 类 型 的 函数 ， 如 is boolean/1 函数 可 以 用 来 检查 参数 是 不 是 布尔 


型 。 


(又 称 元 数 ，arity) 来 识别 。 如 is_boolean/1 表示 
名 为 is_boolean 数 ; 而 is_boolean/2 表示 与 其 同名 、 但 接受 2 个 参 
数 的 不 同 函 数 。 (只 是 打 个 比方 ， 这 样 的 is_boolean 实 际 上 不 存在 ) 
另外 ， < 部 数 名 >/< 元 数 > 这 样 的 表述 是 为 了 在 讲述 函数 时 方便 ， 在 实际 程序 中 如 果 调 用 函 
数 ， 是 不 用 注 明 /1 或 /2 的 。 


受 一 个 参数 的 函 


区 


在 Elixir 中 ， 闷 数 通过 名 称 和 参数 个 数 
， 接 >, 


iex> is_boolean(true) 
true 

iex> is_boolean(1) 
false 


类 似 的 函数 还 有 is_integer/1 ， is_float/1 ? is_number/1 ， 分 别 测试 参数 是 否 是 整 型 、 iF 
点 型 或 者 两 者 其 一 。 


可 以 在 交互 式 命令 行 中 使 用 h 命令 来 打印 函数 或 运算 符 的 帮助 信息 。 
如 h is boolean/1 或 h ==/2 ° 注意 此 处 提 及 某 个 函数 时 ， 不 但 要 给 出 名 称 ， 还 要 加 上 
元 数 /<arity> 。 


12 





2.3- 原 子 


原子 (atom) 是 一 种 常量 ， 名 字 就 是 它 的 值 。 有 些 语言 中 称 其 为 符号 (symbol) 
ruby) 

iex> :hello 

:hello 


iex> :hello == :world 
false 


布尔 值 true 和 false 实际 上 就 是 原子 : 


iex> true == :true 
true 
iex> is_atom(false) 
true 


> kk 
2.4- 字 符 串 
在 Elixir 中 ， 字 符 串 以 双 括 号 LE > KAUTF-8 4 : 


iex> "hell6" 
"hell6" 


Elixir 支 持 字符 串 播 值 (和 ruby 一 样 使 用 #{ ... } ) 


iex> "hello #{:world}" 
“helló world" 


字符 囊 可 以 直接 包含 换行 符 ， 或 者 其 转 义 字符 : 


iex> "hello 

wae wo 
"hello\nworld" 

iex> "hello\nworld" 
"hello\nworld" 


你 可 以 使 用 io 模块 (module) 里 的 I0,puts/1 方法 打印 字符 串 : 


iex> I10.puts "hello\nworld" 
hello 

world 

:ok 


函数 10.puts/1 打印 完 字 符 囊 后 ， 返 回 原子 值 :ok e 


字符 串 在 Elixir 内 部 被 表示 为 二 进 制 数值 (binaries) ， 也 就 是 一 连 串 的 字 节 (bytes) 


iex> is_binary("hell6") 
true 


I eg ered Eni Ne 列表 等 类 型 在 语言 
内 部 就 表示 为 二 进 制 数 值 ， 因 此 它们 也 可 以 被 专门 操作 二 进 制 数 值 的 函数 修改 。 


你 可 以 查看 字符 串 包 含 的 字 节 数量 : 


iex> byte_size("hell6") 
6 


为 啥 是 6? 不 是 5 个 字符 么 ? 注意 里 面 有 一 个 非 ASCII 字 符 6， 在 UTF-8 下 被 编码 为 2 个 字 


° 


do 


我 们 可 以 使 用 专门 的 函数 来 返回 字符 串 中 的 字符 数量 : 


iex> String. length("hell6") 
5 


Sitring 模 块 中 提供 了 很 多 符合 Unicode 标 准 的 函数 来 操作 字符 串 。 如 : 


iex> String.upcase("hell6") 
EOE 人 OY 


记 住 ， 单 引号 和 双 引 号 包 衰 的 字符 串 在 Elixir 中 是 两 种 不 同 的 数据 类 型 : 


iex> 'hellö' == "hell6" 
false 


我 们 将 在 之 后 关于 “二 进 制 、 字 符 囊 与 字符 列表 "章节 中 详细 讲述 它们 的 区 别 。 


2.5-2 4 BH 
在 Elixir 中 ， 使 用 关键 字 fn 和 end 来 界定 函数 。 如 : 


iex> add = fn a, b -> a + b end 
#Function<12.71889879/2 in :erl_eval.expr/5> 
iex> is_function(add) 

true 

iex> is_function(add, 2) 

true 

iex> is_function(add, 1) 

false 

iex> add.(i, 2) 

3 


ALElixir P > BAH 一 等 公民 。 你 可 以 将 函数 作为 参数 传递 给 其 他 函数 ， 就 像 整 型 和 浮 点 型 一 
样 。 在 上 面 的 例子 中 ， 我 们 向 函数 is functions 传递 了 由 变量 add 表示 的 匿名 函数， 结果 
返回 true 。 我 们 还 可 以 调用 函数 is_function/2 来 判断 该 参数 函数 的 元 数 (参数 个 数 ) 。 


注意 ， 在 调用 一 个 匿名 函数 时 ， 在 变量 名 和 写 参数 的 括号 之 间 要 有 个 点 号 (.) 。 


匿名 函数 是 闭 包 ， 意 味 着 它们 可 以 保留 其 定义 的 作用 域 (Scope) 内 的 其 它 变量 值 : 


iex> add two = fn a -> add.(a, 2) end 
#Function<6.71889879/1 in :erl_eval.expr/5> 
iex> add_two. (2) 

4 


这 个 例子 定义 的 匿名 函数 add two 它 内 部 使 用 了 之 前 在 同一 个 iex 内 定义 好 的 add 变量 。 但 要 
注意 ， 在 匿名 函数 内 修改 了 所 引用 的 外 部 变量 的 值 ， 并 不 实际 反映 到 该 变量 上 : 


iex> x = 42 

42 

iex> (fn -> x = 0 end).() 
0 

1ex> x 

42 


这 个 例子 中 匿名 函数 把 引用 了 外 部 变量 x， 并 修改 它 的 值 为 0。 这 时 函数 执行 后 ， 外 部 的 x 没有 
被 影响 。 


2.6- ( 链 式 ) 列表 
Elixir 使 用 方 括号 标识 列表 。 列 表 可 以 包含 任意 类 型 的 值 : 


iex> [1, 2, true, 3] 
Le 2p RUS, S 

iex> length [1, 2, 3] 
3 


两 个 列表 可 以 使 用 ++/2 拼接 ， 使 用 --/2 做 “减法 ”: 


iex> [1, 2, 3] ++ [4, 5, 6] 

[ty 2h ep 4) o d 

iex> [1, true, 2, false, 3, true] -- [true, false] 
A 2p Sip true] 


本 教程 将 多 次 涉及 列表 头 (head) FÆ (tail) 的 概念 。 列 表 的 头 指 的 是 第 一 个 元 素 ， 而 尾 指 
的 是 除了 第 一 个 元 素 以 外 ， 其 它 元 素 组 成 的 列表 。 它们 分 别 可 以 用 函数 naz 和 ti 从 原 列 
表 中 取出 : 


iex> list = [1,2,3] 
iex> hd(list) 


all 
iex> tl(list) 
[2, 3] 


尝试 从 一 个 空 列 表 中 取出 头 或 尾 将 会 报错 : 


iex> hd [] 
** (ArgumentError) argument error 


2.7- 元 组 


Elixir 使 用 大 括号 〈 花 括号 ) 定义 元 组 〈tuples) 。 类 似 列表 ， 元 组 也 可 以 承载 任意 类 型 的 数 
据 : 


iex> {:ok, "hello"} 

{:ok, "hello"} 

iex> tuple_size {:ok, "hello"} 
2 


元 组 使 用 连续 的 内 存 空 间 存储 数据 。 这 意味 着 可 以 很 方便 地 使 用 索引 访问 元 组 数据 ， 以 及 获 
取 元 组 大 小 (索引 从 0 开始 ) 


iex> tuple = {:ok, "hello"} 
{:ok, "hello"} 

iex> elem(tuple, 1) 

“hello: 

iex> tuple_size(tuple) 

2 


AL T AAR A AR RAE A HA put_elem/3 设置 某 个 位 置 的 元 素 值 : 


iex> tuple = {:ok, "hello"} 
{:ok, "hello"} 

iex> put_elem(tuple, 1, "world") 
{:ok, "world"} 

iex> tuple 

{:ok, "hello"} 


注意 函数 put_elem/3 返回 一 个 新 元 组 。 原 来 那个 由 变量 tuple 标 识 的 元 组 没有 被 改变 。 这 是 因 
为 Elixir 的 数据 类 型 是 不 可 变 的 。 这 种 不 可 变性 使 你 永远 不 用 担心 你 的 数据 会 在 某 处 被 某 些 代 
码 改 变 。 在 处 理 并 发 程序 时 ， 这 种 不 可 变性 有 利于 减少 多 个 程序 实体 同时 修改 一 个 数据 结构 
时 引起 的 竞争 以 及 其 他 麻烦 。 


列表 与 元 组 的 区 别 : 列表 在 内 存 中 是 以 链表 的 形式 存储 的 ， 一 个 元 素 指向 下 一 个 元 素 ， 然 后 
再 下 一 个 ... 直 到 到 达 列 表 末 尾 。 我们 称 这 样 的 一 对 数据 (元 素 值 和 指向 下 一 个 元 素 的 指针 ) 
为 列表 的 一 个 单元 (cons cell) 。 


用 Elixir 语 法 表示 这 种 模式 : 


iex> list = [11[21[31[]]]] 
[1, 2, 3] 


列表 方 括号 中 的 坚 线 (|) 表示 列表 头 与 尾 的 分 


这 个 原理 意味 着 获取 列表 的 长 度 是 一 个 线性 操作 : 我 们 必须 遍历 完整 个 列表 才能 知道 它 的 长 
度 。 但 是 列表 的 前 置 拼接 操作 很 快捷 : 


iex> [0] ++ list 
[0, 1, 2, 3] 
iex> list ++ [4] 
[1, 2, 3, 4] 


上 面 例子 中 第 一 条 语句 是 前 置 拼接 操作 ， 执 行 起 来 很 快 。 因 为 它 只 是 简单 地 添加 了 一 个 新 列 
表单 元 ， 它 的 尾 指 针 指 向 原先 列表 头 部 。 而 原先 的 列表 没有 任何 变化 。 


第 二 条 语句 是 后 级 拼接 操作 ， 执 行 速度 较 慢 。 这 是 因为 它 重建 了 原先 的 列表 ， 让 原先 列表 
的 末尾 元 素 指 向 那个 新 元 素 。 


另 一 方面 ， 元 组 在 内 存 中 是 连续 存储 的 。 这 意味 着 获取 元 组 大 小 ， 或 者 使 用 索引 访问 元 组 元 
素 的 操作 十 分 快速 。 但 是 元 组 在 修改 或 添加 元 素 时 开销 很 大 ， 因 为 这 些 操作 会 在 内 存 中 对 元 
组 的 进行 整体 复制 。 


这 些 告诉 我 们 当 如 何在 不 同 的 情况 下 选择 使 用 不 同 的 数据 结构 。 


函数 常用 元 组 来 返回 多 个 信息 。 如 File.read/1 ， 它 读 取 文 件 内 容 ， 返 回 一 个 元 组 : 


iex> File.read("path/to/existing/file") 
TRON: “nom CONCE MES naa} 

iex> File.read("path/to/unknown/file") 
{:error, :enoent} 


如 果 传 递 给 函数 File.read/1 的 文件 路 径 有 效 ， 那 么 函数 返回 一 个 元 组 ， 其 首 元 素 是 原 
F :ok ， 第 二 个 元 素 是 文件 内 容 。 如 果 路 径 无 效 ， 函 数 也 将 返回 一 个 元 组 ， 其 首 元 素 是 原 
子 :error ， 第 二 个 元 素 是 错误 信息 。 


大 多 数 情况 下 ，Elixir 会 引导 你 做 正确 的 事 。 比 如 有 个 叫 elem/2 的 函数 ， a o 
一 个 元 组 元 素 。 个 函数 没有 相应 的 列表 版 本 ， 因 为 根据 存储 机 制 ， 列 表 不 适 过 索引 来 
访问 : 


iex> tuple = {:ok, "hello"} 
{:ok, "hello"} 

iex> elem(tuple, 1) 

nealon 


当 需 要 计算 某 数据 结构 包含 的 元 素 个 数 时 ，Elixir 遵 循 一 个 简单 的 规则 : 如 果 操 作 在 常数 时 间 
内 完成 (答案 是 提前 算 好 的 ) ， 这 样 的 函数 通常 被 命名 为 *size 。 而 如 果 操 作 需 要 显 式 计 
数 ， 那么 该 函数 通常 命名 为 *length ° 


例如 ， 目 前 讲 到 过 的 4 个 计数 函数 : byte_size/1 (用 来 计算 字符 串 有 多 少 字 
节 ) > tuple_size/1 (用 来 计算 元 组 大 小 ) > length (计算 列表 长 度 ) 以 


top kk 


及 string.length/a (计算 字符 串 中 的 字符 数 ) 。 


按照 命名 规则 ， 当 我 们 用 byte_size 获取 字符 串 所 占 字 节 数 时 ， 开 销 较 小 。 但 是 当 我 们 
用 string.length 获取 字符 串 unicode 字 符 个 数 时 ， 需 要 遍历 整个 字符 串 ， 开 销 较 大 。 


除了 本 章 介绍 的 数据 类 型 ，Elixir 还 提供 了 Port’ Reference 和 PID 三 个 数据 类 型 (它们 常用 
于 进程 交互 ) 。 这 些 数据 类 型 将 在 讲解 进程 时 详细 介绍 。 


通过 前 几 章 的 学 习 ， 我 们 知道 Elixir 提 供 了 +，-，*，/ 4 个 算术 运算 符 ， 外 加 整数 除法 函 
数 div/2 和 MA BAR rem/2 © Elixir ae ++ 和 -- 运算 符 来 操作 列表 : 


iex> [1,2,3] ++ [4,5,6] 
[1,2,3,4,5,6] 

iex> [1,2,3] -- [2] 
[1,3] 


使 用 <> 进行 字符 串 拼 接 : 


iex> "foo" <> "bar" 
"foobar" 


Elixir 还 提供 了 三 个 布尔 运算 符 : or and> not 。 这 三 个 运算 符 只 接受 布尔 值 作 为 第 一 个 参 
数 : 


iex> true and true 

enue 

iex> false or is_atom(:example) 
Enue 


如 果 提 供 了 非 布 尔 值 作为 第 一 个 参数 ， 会 报 异 常 : 


iex> 1 and true 
** (ArgumentError) argument error 


运算 符 or 和 and 可 短路 ， 即 它们 仅 在 第 一 个 参数 无 法 决定 整体 结果 的 情况 下 才 执 行 第 二 个 
参 


iex> false and error("This error will never be raised") 
false 


iex> true or error("This error will never be raised") 
true 


如 果 你 是 Erlang 程 序 员 ，Elixir 中 的 and 和 or 其 实 就 是 andalso 和 orelse 运算 符 。 


除了 这 几 个 布尔 运算 符 ，Elixir 还 提供 || > aa 和 ! 运算 符 。 它 们 可 以 接受 任意 类 型 的 参数 
值 。 在 使 用 这 些 运算 n > 除了 false # nil 的 值 都 被 视 作 true : 


# or 

iex> 1 || true 

all 

iex> false || 11 
el 


# and 

iex> nil && 13 
nil 

iex> true && 17 
aly 


# ! 

iex> !true 
false 

iex> !1 
false 

iex> !nil 
true 


根据 经 验 2 当 参 数 确定 是 布尔 时 ， 使 用 and ， or 和 not 3 如 果 非 布尔 值 (或 不 确定 是 不 
是 ) Aee? || Fe 1 © 


>x’ ae 


Elixir 还 提供 了 ssy [a == ty SS ea) Se 这 些 比 较 运 算 符 : 


Tex>° I1 = {1 
true 

TeX> > 
true 

iex> 1 < 2 
true 


其 中 == 和 === 的 不 同 之 处 是 后 者 在 判断 数字 时 更 严格 : 


iex> 1 == 1.0 
true 
iex> 1 === 1.0 
false 


在 Elixir 中 ， 可 以 判断 不 同类 型 数据 的 大 小 : 


iex> 1 < :atom 
true 


这 很 实用 。 排 序 算法 不 必 担心 如 何 处 理 不 同类 型 的 数据 。 总 体 上 ， 不 同类 型 的 排序 顺序 是 : 


number < atom < reference < functions < port < pid < tuple < maps < list < bitstring 


不 用 强 记 ， 只 要 知道 有 这 么 回 事 儿 就 可 以 。 


be ` 
Z N, Ae 
本 章 起 教程 进入 不 那么 基础 的 阶段 ， 开 始 涉及 函数 式 编程 概念 。 对 之 前 没有 函数 式 编 程 经 验 
的 人 来 说 ， 这 一 章 是 一 个 基础 ， 需 要 好 好 学 习 和 理解 。 
在 Elixir 中 ，= 运算 符 实 际 上 叫做 匹配 运算 符 。 本 章 将 讲解 如 何 使 用 = 运算 符 来 对 各 种 数据 


云 
结构 进行 模式 匹配 。 最 后 本 章 还 会 讲解 pin 运 算 符 ( ^ )， 用 来 访问 某 变 量 之 前 绑 定 的 值 。 


os 


4.1- 匹 配 运算 符 


我 们 已 经 多 次 使 用 = 符号 进行 变量 的 赋值 操作 : 


在 Elixir 中 ，= 作为 匹配 运算 符 。 下 面 来 学 习 这 样 的 概念 : 


iex> 1 = x 

al 

iex> 2 = x 

** (MatchError) no match of right hand side value: 1 


注意 1 = x 是 一 个 合法 的 表达 式 。 由 于 前 面 的 例子 给 x 赋值 为 1， 因 此 在 匹配 时 左右 相同 ， 所 
以 它 匹 配 成 功 了 。 而 两 侧 不 匹配 的 时 候 ，MatchError 将 被 抛 出 。 


变量 只 有 在 匹配 操作 符 = 的 左 侧 时 才 被 赋值 : 


iex> 1 = unknown 
** (RuntimeError) undefined function: unknown/0 


车 误 原因 是 unknown 变 量 没 有 被 典 过 值 ，Elixir 猜 你 想 调 用 一 个 名 叫 unknown/9 的 元 数 ， 但 是 
找 不 到 这 样 的 函数 。 


> 变量 名 在 等 号 左边 ，Elixir 认 为 是 赋值 表达 式 ; 变量 名 放 在 右边 ，Elixir 认 为 是 拿 该 变量 的 值 
和 左边 的 值 做 匹配 。 


4.2- 模 式 匹 配 


匹配 运算 符 不 光 可 以 匹配 简单 数值 ， 还 能 用 来 解构 复杂 的 数据 类 型 。 例 如 ， 我 们 在 元 组 上 使 
用 模式 匹配 : 


iex> {a, b, c} = {:hello, "world", 42} 
{:hello, "world", 42} 

iex> a 

:hello 

iex> b 

"world" 


在 两 端 不 匹配 的 情况 下 ， 模 式 匹 配 会 失败 。 比 方 说 ， 匹 配 的 两 端的 元 组 不 一 样 长 : 


iex> {a, b, c} = {:hello, "world"} 
** (MatchError) no match of right hand side value: {:hello, "world"} 


或 者 两 端 模式 有 区 别 (比如 两 端 数据 类 型 不 同 ) 


iex> {a, b, c} = [:hello, "world", "!"] 
** (MatchError) no match of right hand side value: [:hello, "world", "!"] 


利用 “匹配 ”的 这 个 概念 ， 我 们 可 以 匹配 特定 值 ， 或 者 在 匹配 成 功 时 。 
下 面 例子 中 先 写 好 了 匹配 的 左 端 ， 它 要 求 右 端 必 须 是 个 元 组 ， 且 第 一 个 元 素 是 原子 :ok ° 


iex> {:ok, result} = {:ok, 13} 
{:ok, 13} 

iex> result 

13 


iex> {:ok, result} = {:error, :oops} 
** (MatchError) no match of right hand side value: {:error, :oops} 


用 在 列表 上 : 


iex> [a, 2, 3] = [1, 2, 3] 
[1, 2, 3] 

iex> a 

al 


列表 支持 匹配 自己 的 head 和 tail (这 相当 于 同时 调用 hd/1 和 tl/1 ， 给 head 和 tail 赋 
值 ) 


iex> [head | tail] = [1, 2, 3] 
iy 2p 2 

iex> head 

1 

iex> tail 

(ani 


同 hd/1 和 t1/1 BAH > VAL AR AR RAR ED] EMA: 


iex> [h|t] = [] 
** (MatchError) no match of right hand side value: [] 


> [headltai 训 这 种 形式 不 光 在 模式 匹配 时 可 以 用 ， 还 可 以 用 作 向 列表 插入 前 置 数值 : 


iex> list = [1, 2, 3] 
(1, 2, 3] 

iex> [O|list] 

[9, 1, 2, 3] 


模式 匹配 使 得 程序 员 可 以 容易 地 解构 数据 结构 (如 元 组 和 列表 ) 。 在 后 面 我 们 还 会 看 到 ， 它 
是 Elixir 的 一 个 基础 ， 对 其 它 数 据 结 构 同 样 适 用 ， 比 如 图 和 二 进 制 。 


e 模式 匹配 使 用 = 符号 

o 匹配 中 等 号 左右 的 “模式 "必须 相同 

° oe 

e@ 变量 在 右 侧 时 必须 有 值 ，Elixir 拿 这 个 值 和 堪 侧 相应 位 置 的 元 素 做 匹配 


4.3-pin 运 算 符 


在 Elixir 中 ， 变 量 可 以 被 重新 绑 定 : 


Elixir T AARE EHME (WME) 。 它 带 来 一 个 问题 ， 就 是 对 一 个 单独 变量 (而 且 是 放 
在 左 端 ) 做 匹配 时 ，Elixir 会 认为 这 是 一 个 重新 绑 定 〈 赋 值 ) 操作 ， 而 不 会 当成 匹配 ， 执 
AT LC Ho 这 里 就 要 用 到 pin 运 算 符 。 


如 果 你 不 想 这 样 ， 可 以 使 用 pin 运 算 符 (^)。 加 上 了 pin 运 算 符 的 变量 ， 在 匹配 时 使 用 的 值 是 本 
次 匹配 前 就 赋予 的 值 : 


iex> x = 1 

al 

iex> Ax = 2 

** (MatchError) no match of right hand side value: 2 
iex> {x, ^x} = {2, 1} 


{2, 1} 
iex> x 
2 


注意 如 果 一 个 变量 在 匹配 中 被 引用 超过 一 次 ， 所 有 的 引用 都 应 该 绑 定 同一 个 模式 : 


iex> {x, x} = {1, i} 
1 


iex> {x, x} = {1, 2} 
** (MatchError) no match of right hand side value: {1, 2} 


有 些 时 候 ， 你 并 不 在 意 模式 匹配 中 的 一 些 值 。 可 以 把 它们 绑 定 到 特殊 的 变量 " _” 
(underscore) 上 。 例如 ， 如 果 你 只 想 要 某 列表 的 head ， 而 不 要 tail 值 。 你 可 以 这 么 做 : 


eye lin || = | = by 2 al 
ly Ze Sal 

iex> h 

al 


变量 * "特殊 之 处 在 于 它 不 能 被 读 ， 党 试 读 取 它 会 报 "未 绑 定 的 变量 "错误 : 


iex> _ 
** (CompileError) iex:1: unbound variable _ 


尽管 模式 匹配 看 起 来 如 此 牛 通 ， 但 是 语言 还 是 对 它 的 作用 做 了 一 些 限制 。 上 比如 ， 你 不 能 让 函 
数 调用 作为 模式 匹配 的 左 端 ?下 面 例子 就 是 非法 的 : 


iex> length([1,[2],3]) = 3 
** (CompileError) iex:1: illegal pattern 


模式 匹配 介绍 完了 。 在 以 后 的 章节 中 ， 模 式 匹 配 是 常用 的 语法 结构 。 


` 


5- 流 程控 制 


case 
ERP APH RAR 
cond 

if 和 unless 

do 语句 块 


本 章 讲解 case，cond 和 if 的 流程 控制 结构 。 


5.1-case 
case 将 一 个 值 与 许多 模式 进行 匹配 ， 直 到 找到 一 个 匹配 成 功 的 : 


iex> case {1, 2, 3} do 
vee i, i Gh as 
"This clause won't match" 
a, X, 3} Se 
"This clause will match and bind x to 2 in this clause" 
-> 
"This clause would match any value" 
end 


VVVVVV 


如 果 与 一 个 已 赋值 的 变量 做 比较 ， 要 用 pin 运 算 符 (A) 标 记 该 变量 : 


Tex> Xx = ail 
al 
iex> case 10 do 

> Ax -> "Won't match" 
ee —  -> "Will match" 
...> end 


可 以 加 上 卫兵 子 句 〈guard clauses) 提供 额外 的 条 件 : 


iex> case {1, 2, 3} do 
ae {1, x, 3} when x > 0 -> 


> "Will match" 
S _ -> 

> "Won't match" 

> end 


于 是 上 面 例子 中 ， 第 一 个 待 比较 的 模式 多 了 一 个 条 件 : X 必 须 是 正 数 。 


5.2- 卫 兵 子 名 中 的 表达 式 


Erlang 中 只 允许 以 下 表达 式 出 现在 卫兵 子 名 中 : 


d= RE kk 


ES ARS mie ncn ee Se) 
e 布尔 运算 符 〈and，or) 以 及 否定 运算 符 (not?!) 
。 算数 运算 符 (+，-，*，/) 

。 <> 和 ++ 如 果 左 端 是 字面 值 

e in 运算 符 

以 下 类 型 判断 函数 : 

o is_atom/1 


o is_binary/1 
o is_bitstring/1 
o is_boolean/1 
o is_float/1 
o js _function/1 
o jis _function/2 
o is_integer/1 
o is_list/1 
o is_map/1 
o is_number/1 
o is_pid/1 
o is_reference/1 
o is_tuple/1 
o 外 加 以 下 函数 : 
o abs(number) 
o bit_size(bitstring) 
o byte_size(bitstring) 
o div(integer, integer) 
o elem(tuple, n) 
o hd(list) 
o length(list) 
o map_size(map) 
o node() 
o node(pid | ref | port) 
o rem(integer, integer) 
© round(number) 
o self() 
o ti(list) 
o trunc(number) 
o tuple_size(tuple) 


记 住 ， 卫 兵 子 名 中 出 现 的 错误 不 会 漏出 ， 只 会 简单 地 让 卫兵 条 件 失败 : 


iex> hd(1) 
** (ArgumentError) argument error 
:erlang.hd(1) 

iex> case 1 do 
To x when hd(x) -> "Won't match" 
ae X -> "Got: #{x}" 

> (lite! 

"Got alt 


如 果 case 中 没有 一 条 模式 能 匹配 ， 会 报错 : 


iex> case :ok do 

ee :error -> "Won't match" 

"= .> end 

** (CaseClauseError) no case clause matching: :ok 


匿名 防 数 也 可 以 像 下 面 这 样 ， 用 多 个 模式 或 卫兵 条 件 来 灵活 地 匹配 该 函数 的 参数 : 


iex> f = fn 
> x, y whenx>0 -> x+y 
aoe X WY Se oe y 
...> end 
#Function<12.71889879/2 in :erl_eval.expr/5> 
iex> f.(1, 3) 
4 
iex> f.(-1, 3) 
-3 


需要 注意 的 是 ， 所 有 case 模 式 中 表示 的 参数 个 数 必 须 一 致 ， 否 则 会 报错 。 上 面 的 例子 两 个 待 
匹配 模式 都 是 x，y。 如 果 再 有 一 个 模式 表示 的 参数 是 x，y，z， 那 就 不 行 : 


iex(5)> f2 = fn 

ron(oe X,Y -> Xty 

(D> X,Y,Z -> x+y+z 

(D> end 

** (CompileError) iex:5: cannot mix clauses with different arities in function definition 
(elixir) src/elixir_translator.erl:17: :elixir_translator.translate/2 


E A = A 


5.3-cond 


case 是 拿 一 个 值 去 同 多 个 值 或 模式 进行 匹配 ， 匹 配 了 就 执行 那个 分 支 的 语句 。 然而 ， 许 多 情 
况 下 我 们 要 检查 不 同 的 条 件 ， 找 到 第 一 个 结果 为 true 的 ， 执 行 它 的 分 支 。 这 时 我 们 用 cond : 


iex> cond do 
eS 2a Dea =p 


= "This will not be true" 
neo 2e aoe 
.> "Nor this" 
ree 1 + 1 == 2 -> 
ane: "But this will" 
.> end 


“BUE ENIS wad" 


这 样 的 写法 和 命令 式 语 言 里 的 else if 差不多 一 个 意思 (尽管 很 少 这 么 写 ) 


如 果 没 有 一 个 条 件 结果 为 true， 会 报错 。 因 此 ， 实 际 应 用 中 通常 会 使 用 true 作 为 ames 
件 。 ai mei 件 没 有 一 个 是 true， 那 么 该 cond 表 达 式 至 少 还 可 以 执行 这 最 后 一 个 分 
支 : 


iex> cond do 
> 2 + 2 == 5 -> 


> -nsens never true” 

one 2* 2 == 3 -> 

> "Nor this" 

noe true > 

> "This is always true (equivalent to else)" 
..> end 


用 法 就 好 像 许 多 语言 中 ，switch 语 名 中 的 default 一 样 。 


后 需要 注意 的 是 ，cond 视 所 有 非 false 和 nil 的 值 为 true : 


iex> cond do 
本 全 hd([1,2,3]) -> 
i> "1 is considered as true" 
..> end 

"1 is considered as true" 


5.4 if 和 unless 
除了 case 和 cond，Elixir 还 提供 了 两 很 常用 的 宏 : if/2 和 unless/2 ， 用 它们 检查 单个 条 件 : 


iex> if true do 
sa "This works!" 

...> end 

"This works!" 

iex> unless true do 
> "This will never be seen" 
..> end 

nil 


to RY if/2 的 条 件 结果 为 false 或 者 nil， 那 么 它 在 do/end 间 的 语句 块 就 不 会 执行 ， 该 表达 式 
返回 nil。 unless/2 相反 。 


它们 都 支持 else 语 句 块 : 


iex> if nil do 
> "This won't be seen" 
..> else 
> "This will" 

...> end 

"This will" 


有 趣 的 是 ， if/2 和 unless/2 是 以 宏 的 形式 提供 的 ， 而 不 像 在 很 多 语言 中 那样 是 语句 。 
可 以 阅读 文档 或 if/2 的 源码 (Kernel 模 块 ) 。 Kernel 模块 还 定义 了 诸如 +/2 运算 符 
和 is function/2 Bo 它们 默认 被 导入 ， 因 而 在 你 的 代码 中 可 用 。 


5.5- do 1% 4) 3 


以 上 讲解 的 4 种 流程 控制 结构 : case > cond ，if 和 unless， 它 们 都 被 包 庄 在 do/end 语 句 块 中 
即使 我 们 把 if 语 名 写成 这 样 : 


iex> if true, do: 1 + 2 
3 


在 Elixir 中 ，do/end 语 和 句 块 方便 地 将 一 组 表达 式 传递 给 do: 。 以 下 是 等 同 的 : 


iex> if true do 
Hee a=1+2 
> El ar (6) 

...> end 

13 

iex> if true, do: ( 
ae a=1+2 
Bates a+ 10 
>) 

als} 


我 们 称 第 二 种 语法 使 用 了 关键 字 列 表 (keyword lists) 。 我 们 可 以 这 样 传递 else 


iex> if false, do: :this, else: :that 
:that 


注意 一 点 ，do/end 语 句 块 永远 是 被 绑 定 在 最 外 层 的 函数 调用 上 。 例 如 : 


iex> is_number if true do 
meee aly ore 322 
...> end 


将 被 解析 为 : 


iex> is_number(if true) do 
moe ll oP A 
ena 


这 使 得 Elixir 认 为 你 是 要 调用 函数 is number/2 (第 一 个 参数 是 if true ， 第 二 个 是 语句 块 ) 。 
时 就 需要 加 上 括号 解决 二 义 性 : 


o 


这 


iex> is_number(if true do 


eee a A2 
> end) 
true 


关键 字 列表 在 Elixir 语 言 中 占有 重要 地 位 ， 在 许多 函数 和 宏 中 都 有 使 用 。 后 文中 还 
详解 。 


6- 二 进 制 - 字 符 串 -字符 列表 


UTF-8 和 Unicode 
二 进 制 《和 bitstring ) 
字符 列表 


在 “基本 类 型 "一 章 中 ， 介 绍 了 字符 串 ， 以 及 使 用 is_binary/1 函数 检查 它 : 


iex> string = "hello" 
“helio 

iex> is_binary string 
true 


本 章 将 学 习 理 解 ， 二 进 制 (binaries) 是 个 哈 ， 它 怎么 和 字符 串 扯 上 关系 的 。 以 及 用 单 引号 包 


Rath ‘like this' TA Š$ ° 


6.1-UTF-8 和 Unicode 


字符 串 是 UTF-8 编 码 的 二 进 制 。 为 了 再 清 这 名 话 啥 意思 ， 我 们 要 先 理 解 两 个 概念 : bytes 和 
code point 的 区 别 。 字母 a 的 code point 是 97， 而 字母 4 的 code point 是 322。 当 把 字符 

串 "hetto" 写 到 硬盘 上 的 时 候 ， 需 要 将 其 code point 转 化 为 bytes。 如 果 一 个 byte 对 应 一 个 
code point， 那 是 写 不 了 "hetto" 的 ， 因 为 字母 4 的 code point 是 322， 超 过 了 一 个 byte 所 能 
存储 的 最 大 数值 (255) 。 但 是 如 你 所 见 ， 该 字母 能 够 显示 到 屏幕 上 ， 说 明 还 是 有 一 定 的 解 
决 方法 的 。 于 是 编码 便 出 现 了 。 


要 用 byte 表 示 code point， 我 们 需要 在 一 定 程 度 上 对 其 进行 编码 。 Elixir 使 用 UTF-8 为 默认 编码 
格式 。 当 我 们 说 菜 个 字符 串 是 UTF-8 编 码 的 二 进 制 数据 ， 意 思 是 该 字符 串 是 一 串 byte ， 以 一 
定 方法 组 织 来 表示 特定 的 code points， 即 UTF-8 编 码 。 


因此 当 我 们 存储 字母 1 的 时 候 ， 实 际 上 是 用 两 个 bytes 来 表示 它 。 这 就 是 为 什么 有 时 候 对 同 
一 字符 串 ， 调 用 函数 byte_size/1 和 string.length/1 结果 不 一 样 : 


iex> string = "hełło" 
"hetio" 

iex> byte_size string 

7 

iex> String.length string 
5 


UTF-8 需 要 1 个 byte 来 表示 code points : h，e 和 0， 用 2 个 bytes 表 示 |。 在 Elixir 中 可 以 使 


用 ? 运算 符 获 取 code point 值 : 


jex> ?a 


你 还 可 以 使 用 String 模 块 里 的 函数 将 字符 串 切 成 单独 的 code points : 


iex> String.codepoints("hetto") 
ha Henn WE os DE a Sow 


Elixir 为 字符 串 操 作 提 供 了 强大 的 支持 。 实 际 上 ，Elixir 通 过 了 文章 “字符 串 类 型 破 了 ”记录 的 所 
有 测试 。 

不 仅 如 此 ， 因 为 字符 串 是 二 进 制 ，Elixir 还 提供 了 更 强大 的 底层 类 型 的 操作 。 下面 就 来 介绍 节 
底层 类 型 --- 二 进 制 o 

6.2- 二 进 制 《和 bitstring ) 

在 Elixir 中 可 以 用 <<>> 定义 一 个 二 进 制 : 


iex> <<0, 1, 2, 3>> 
<0 1 2, 3>> 
iex> byte size <<0, 1, 2, 3>> 


一 个 二 进 制 只 是 一 连 串 bytes。 这 些 bytes 可 以 以 任何 方法 组 织 ， 即 使 凑 不 成 一 个 合法 的 字符 


iex> String.valid?(<<239, 191, 191>>) 
false 


字符 囊 的 拼接 操作 实际 上 是 二 进 制 的 拼接 操作 : 


jex> <<0, 1>> <> <<2, 3>> 
<<O 2 93>> 


一 个 常见 技巧 是 ， 通 过 给 某 字 符 串 尾部 拼接 一 个 null byte <<o>> ， 来 看 看 该 字符 串 内 部 二 
制 的 样子 : 


iex> "hetto" <> <<0>> 
<<104, 101, 197, 130, 197, 130, 111, 0>> 


二 进 制 中 的 每 个 数值 都 表示 一 个 byte， 因 此 其 最 大 是 255。 如 果 超 出 了 255， 二 进 制 允许 你 再 
提供 一 个 修改 器 〈 标 识 一 下 那个 位 置 的 存储 空间 大 小 ) 使 其 可 以 存储 ; 或 者 将 其 转换 为 utf8 
编码 后 的 形式 〈 变 成 多 个 byte 的 二 进 制 ) 


也 可 以 对 二 进 


子 ， 匹 配 的 左右 两 端 不 


hawt 


也 是 一 个 意思 


iex> <<255>> 

<<255>> 

iex> <<256>> # truncated 
<<Q>> 

1ex> <<256 :: 
<<1, 0>> 
Tex <<256. 40 
HUAN 

iex> <<256 :: utf8, 0>> 
<<196, 128, 0>> 


utf8>> # the number is a code point 


如 果 一 个 byte 是 8 bits， 那 如 果 我 们 给 一 个 size 是 1 bit 的 修改 


iex> <<1 :: size(i)>> 
<<i::size(1)>> 
iex> <<2 :: Size(1)>> # truncated 


<<0::size(1)>> 


iex> is_binary(<< 1 :: size(1)>>) 
false 

iex> is_bitstring(<< 1 :: size(i)>>) 
true 

iex> bit_size(<< 1 :: size(i)>>) 

all 


zA 
ae 


=a 


size(16)>> # use 16 bits (2 bytes) to store the number 


会 怎样 2 : 


aH (APART bit) 就 不 再 是 二 进 制 《人 家 每 个 元 素 是 byte， 至 少 8 bits) T> HR 


bitstring， 就 是 一 串 比 特 ! 所 以 实际 上 二 进 


制 或 bitstring 做 模式 匹配 : 


iex> <<0，1，X>> = <<0, 1, 2>> 

<<0, 1, 2>> 

iex> x 

2 

iex> <<0, 1, x>> = <<0, 1, 2, 3>> 

** (MatchError) no match of right hand side value: 


注意 (没有 修改 器 标识 的 情况 下 ) 二 进 
具有 相同 容量 ， 因 此 出 现 错误 。 


下 面 是 使 用 了 修改 器 标识 的 匹配 例子 : 


iex> <<0, 1, xX :: 
<<0 a2 >> 
iex> x 

<<2, 95S 


binary>> = <<0, 1, 2, 3>> 


ZNIE 


iex> "he" <> rest = "hello" 
"hello" 

iex> rest 

"iion 


H 尾部 元 素 被 修改 器 标识 为 又 一 个 二 进 


制 中 的 每 个 元 素 都 应 该 匹配 8 bits 。 因此 上 面 最 后 


制 就 是 一 串 比 特 ， 只 是 比特 数 是 8 的 倍数 。 


<<0, 1, 2, 3>> 


的 例 


制 时 才 正 确 。 字符 串 的 连接 操作 


总 之 ， 记 住 字 符 串 是 UTF-8 编 码 的 二 进 制 ， 而 二 进 制 是 特殊 的 、 数 量 是 8 的 倍数 的 bitstring。 
这 种 机 制 增加 了 Elixir 在 处 理 bits 或 bytes 时 的 灵活 性 。 而 现实 中 99% 的 时 候 你 会 
用 is_binary/1 和 byte_size/1 函数 跟 二 进 制 打交道 。 


> kk 
6.3- 字 符 列表 
字符 列表 就 是 字符 的 列表 。 CI SOREHR FORFAR 


jex> 'heito' 

[LOAF ROIs 22) 322 AT 
iex> is_list 'hetio' 

true 

iex> 'hello' 

"hello' 


字符 列表 存储 的 不 是 bytes， 而 是 字符 的 code points (实际 上 就 是 这 些 code points 的 普通 列 
表 ) 。 如 果 某 字符 不 属于 ASCII 返 回 ，iex 就 打印 它 的 code point 。 


实际 应 用 中 ， 字 符 列表 常 被 用 来 做 参数 ， 同 一 些 老 的 库 ， 或 者 同 Erlang 平 台 交 互 。 因 为 这 些 
老 库 不 接受 二 进 制作 为 参数 。 将 字符 列表 和 字符 串 之 间 转 换 ， 使 用 函 


数 to_string/1 和 to_char_list/1 


iex> to_char_list "hetto" 
[404 tet, 322) 322 J11 
iex> to_string 'hełło' 
hertzo 

iex> to_string :hello 
"hello" 

iex> to_string 1 

a! 


注意 这 些 函 数 是 多 态 的 。 它 们 不 但 转化 字符 列表 和 字符 囊 ， 还 能 转化 字符 囊 和 整数 ， 等 等 。 


7- 键 值 列表 -图 -字典 


键 值 列 表 
图 


字典 


到 目前 还 没有 讲 到 任何 关联 性 数据 结构 ， 即 那 种 可 以 将 一 个 或 几 个 值 关 联 到 一 个 key 上 。 不 同 
语言 有 不 同 的 叫 法 ， 如 字典 ， 哈 希 ， 关 联 数组 ， 图， 等 等 。 


Elixir 中 有 两 种 主要 的 关联 性 结构 : 键 值 列表 (keyword list) 和 图 (map) ° 


7.1- 键 值 列表 


在 很 多 函数 式 语言 中 ， 常 用 二 元 元 组 的 列表 来 表示 关联 性 数据 结构 。 在 Elixir 中 也 是 这 样 。 当 
我 们 有 了 一 个 元 组 (不 一 定 仅 有 两 个 元 素 的 元 组 ) 的 列表 ， 并 且 每 个 元 组 的 第 一 个 元 素 是 个 
原子 ， 那 就 称 之 为 键 值 列 表 : 


iex> list = [{:a, 1}, {:b, 2}] 
[aus ale 2 

iex> list == [a: 1, b: 2] 

tnue 

iex> list[:a] 

T 


当 原 子 key 和 关联 的 值 之 间 没 有 运 号 分 隔 时 ， 可 以 把 原子 的 冒号 拿 到 字母 的 后 面 。 这 时 ， 
原子 与 后 面 的 数值 之 间 要 有 一 个 空格 。 


如 你 所 见 ，Elixir 使 用 比较 特殊 的 语法 来 定义 这 样 的 列表 ， 但 实际 上 它们 会 映射 到 一 个 元 组 列 
表 。 因为 它们 是 简单 的 列表 而 已 ， 所 有 针对 列表 的 操作 ， 键 值 列表 也 可 以 用 。 


比如 ， 可 以 用 ++ 运算 符 为 列表 添加 元 素 : 


iex> list ++ lce: 3] 
eke al, 18 25 CR S] 
iex> [a: 0] ++ list 
lan OF aise a | 


上 面 例子 中 重复 出 现 了 :a 这 个 key， 这 是 允许 的 。 以 这 个 key 取 值 时 ， 取 回来 的 是 第 一 个 找 
到 的 (因为 有 序 ) 


iex> new list = [a: 0] ++ list 
[ais onan: 

iex> new_list[:a] 

0 


键 值 列表 十 分 重要 ， 它 有 两 大 特点 : 


© A 
e key 可 以 重复 ( ! 仔细 看 上 面 两 个 示例 ) 


例如 ，Ecto 库 使 用 这 两 个 特点 写 出 了 精巧 的 DSL (用 来 写 数 据 库 query ) 


query = from w in Weather, 
where: w.prcp > 0, 
where: w.temp < 20, 
select: w 


这 些 特 性 使 得 键 值 列表 成 了 Elixir 中 为 函数 提供 额外 选项 的 默认 手段 。 在 第 5 章 我 们 讨论 
了 if/2 宏 ， 提 到 了 下 方 的 语法 : 


iex> if false, do: :this, else: :that 
:that 


do: 和 else: 就 是 键 值 列表 ! 事实 上 代码 等 同 于 : 


iex> if(false, [do: :this, else: :that]) 
:that 


当 键 值 列 表 是 函数 最 后 一 个 参数 时 ， 方 括号 就 成 了 可 选 的 。 


为 了 操作 关键 字 列 表 ，Elixir 提 供 了 键 值 (keyword) 模块 。 记 住 ， 键 值 列 表 就 是 简单 的 列 
表 ， 和 列表 一 样 提供 了 线性 的 性 能 。 列表 越 长 ， 获 取 长 度 或 找到 一 个 键 值 的 速度 越 慢 。 
此 ， 关 键 字 列表 在 Elixir 中 一 般 就 作为 函数 调用 的 可 选项 。 如 果 你 要 存储 大 量 数据 ， 并 且 保 证 
一 个 键 只 对 应 最 多 一 个 值 ， 那 就 使 用 图 。 


对 键 值 列表 做 模式 匹配 : 


iex> [a: a] = [a: 1] 


[a: 1] 
iex> a 
1 


iex> [a: a] = [a: i, b: 2] 

** (MatchError) no match of right hand side value: [a: 1, b: 2] 
iex> [b: b, a: a] = [a: i, b: 2] 

** (MatchError) no match of right hand side value: [a: 1, b: 2] 


尽管 如 此 ， 对 列表 使 用 模式 匹配 很 少 用 到 。 因 为 不 但 要 元 素 个 数 相等 ， 顺 序 还 要 匹配 。 


7.2- 图 (maps) 


无 论 何 时 想 用 键 - 值 结构 ， 图 都 应 该 是 你 的 第 一 选择 。Elixir 中 ， 用 w{} 定义 图 : 


iex> map = %{:a => 1, 2 => :b} 
%{2 => :b, :a => 1} 

iex> map[:a] 

al 


iex> map[2] 
:b 


和 和 键 值 列 表 对 比 ， 图 有 两 主要 区 别 : 


。 图 允许 任何 类 型 值 作为 键 
。 图 的 键 没有 顺序 


如 果 你 向 图 添加 一 个 已 有 的 键 ， 将 会 复 盖 之 前 的 键 - 值 对 : 


iex> %{1 => 1, 1 => 2} 
%{1 => 2} 


如 果 图 中 的 键 都 是 原子 ， 那 么 你 也 可 以 用 键 值 列 表 中 的 一 些 语法 : 


iex> map = %{a: 1, b: 2} 
%{a: 1, b: 2} 


对 比 键 值 列 表 ， 图 的 模式 匹配 很 是 有 用 : 


iex> %{} = %{:a => 1, 2 => :b} 

%{:a => 1, 2 => :b} 

iex> %{:a => a} = %{:a => 1, 2 => :b} 

%{:a => 1, 2 => :b} 

iex> a 

al 

iex> %{:c => c} = %{:a => 1, 2 => :b} 

** (MatchError) no match of right hand side value: %{2 => :b, :a => 1} 


如 上 所 示 ， 图 A 与 另 一 个 图 B 做 匹配 。 图 B 中 只 要 包含 有 图 A 的 键 ， 那 么 两 个 图 就 能 匹配 上 。 
若 图 A 是 个 空 的 ， 那 么 任意 图 B 都 能 匹配 上 。 但 是 如 果 图 B 里 不 包含 图 A 的 键 ， 那 就 匹配 失败 


Ts 


图 还 有 个 有 趣 的 功能 : 它 提 供 了 特殊 的 语法 来 修改 和 访问 原子 键 : 


iex> map = %{:a => 1, 2 => :b} 


%{:a => 1, 2 => :b} 
iex> map.a 

all 

iex> %{map | :a => 2} 


%{:a => 2, 2 => :b} 
iex> %{map | :c => 3} 
** (ArgumentError) argument error 


使 用 上 面 两 种 语法 要 求 的 前 提 是 所 给 的 键 是 切实 存在 的 。 最 后 一 条 语句 错误 的 原因 就 是 


键 :c 不 存在 


未 来 几 章 中 我 们 还 将 讨论 结构 体 (structs) 。 结 构 体 提供 了 编译 时 的 保证 ， 它 是 Elixir 多 BAY 
基础 。 结构 体 是 基于 图 的 ， 上 面 例子 提 到 的 修改 键 值 的 前 提 就 变 得 十 分 重要 。 


图 模块 提供 了 许多 关于 图 的 操作 。 它 提 供 了 与 键 值 列表 许多 相似 的 API， 因 为 这 两 个 数据 结构 
都 实现 了 字典 的 行为 。 


图 是 最 近 连 同 EEP 43 被 引入 Erlang 虚 拟 机 的 。Erlang 174144 JEEPS Sh > & 
持 一 小 部 分 图 功能 。 这 意味 着 图 仅 在 存储 不 多 的 键 时 ， 图 的 性 能 还 行 。 为 ee =I] 
题 ，Elixir 还 提供 了 HashDict 模 块 。 该 模块 提供 了 一 个 字典 来 支持 大 量 的 键 ， 并 且 性 能 不 


7.3- 字 典 (Dicts) 


Elixir 中 ， 键 值 列 表 和 图 都 被 称 作 字典 。 换 句 话说， 一 个 字典 就 像 一 个 接口 (在 Elixir 中 称 之 为 
行为 behaviour) 。 键 值 列 表 和 图 模块 实现 了 该 接口 。 
这 个 接口 定义 于 Dict 模 块 ， 该 模块 还 提供 了 底层 实现 的 一 个 API : 


iex> keyword = [] 


iex> map = %{} 


%{} 

iex> Dict.put(keyword, :a, 1) 
[a: 1 

iex> Dict.put(map, :a, 1) 
%{a: 1} 


字典 模块 允许 开发 者 实现 自己 的 字典 形式 ， 提 供 一 些 特殊 的 功能 。 字典 模块 还 提供 了 所 有 字 
典 类 型 都 可 以 使 用 的 函数 。 如 ， Dicr.equal?/2 可 以 比较 两 个 字典 类 型 (可 以 是 不 同 的 实 
) 


你 会 疑惑 些 程序 时 用 keyword，Map 还 是 Dict 模 块 呢 ?答案 是 : 看 情况 。 


如 果 你 的 代码 期 望 接受 一 个 关键 字 作为 参数 ， 那 么 使 用 简直 列表 模块 。 如 果 你 想 操作 一 个 
图 ， 那 就 使 用 图 模块 。 如 果 你 想 你 的 AP| 对 所 有 字典 类 型 的 实现 都 有 用 ， 那 就 使 用 字典 模块 
(确保 以 不 同 的 实现 作为 参数 测试 一 下 ) 。 


8- 模 块 


编译 

脚本 模式 
命名 函数 
函数 捕捉 
默认 参数 


Elixir 中 我 们 把 许多 函数 组 织 成 一 个 模块 。 我 们 在 前 几 章 已 经 提 到 了 许多 模块 ， 如 String 模 
块 : 


iex> String.length "hello" 
5 


创建 自 己 的 模块 ， 用 defmodule Æ ° M def 宏 在 其 中 定义 函数 : 


iex> defmodule Math do 
aoe def sum(a, b) do 


本 a+b 
> end 
...> end 


iex> Math.sum(1, 2) 
3 


像 ruby 一 样 ， 模 块 名 大 写 起 头 


8.1- 编 译 
通常 把 模块 写 进 文件 ， 这 样 可 以 编译 和 重用 。 假 如 文件 math.ex 有 如 下 内 容 : 


defmodule Math do 
def sum(a, b) do 
a + b 
end 
end 


这 个 文件 可 以 用 elixirc 进行 编译 : 


$ elixirc math.ex 


这 将 生成 名 为 Elixir.Math.beam 的 bytecode 文 件 。 如 果 这 时 再 启动 ex， 那 么 这 个 模块 就 已 经 
可 以 用 了 (假如 在 含有 该 编译 文件 的 目录 启动 iex) 


iex> Math.sum(1, 2) 
3 


Elixir 工 程 通常 组 织 在 三 个 文件 夹 里 : 


e ebin， 包 括 编译 后 的 字 节 码 
e lib， 包 括 Elixir 代 码 ( .ex 文件 ) 
e test， 测 试 代码 (.exs 文 件 ) 


实际 项 目 中 ， 构 建 工具 Mix 会 负责 编译 ， 并 且 设 置 好 正确 的 路 径 。 而 为 了 学 习 方 便 ，Elixir 也 
提供 了 脚本 模式 ， 可 以 更 灵活 而 不 用 编译 。 


8.2- 脚 本 模式 


除了 .ex 文件 ，Elixir 还 支持 .exs 脚 本 文件 。 Elixir 对 两 种 文件 一 视 同 仁 ， 唯 一 区 别 是 .ex 文件 会 
保留 编译 执行 后 产 出 的 比特 码 文件 ， 而 .exs 文 件 用 来 作 脚本 执行 ， 不 会 留 下 比特 码 文件 。 例 
如 ， 如 下 创建 名 为 math.exs 的 文件 : 


defmodule Math do 
def sum(a, b) do 
a+b 
end 
end 


IO.puts Math.sum(1, 2) 
执行 之 : 
$ elixir math.exs 


像 这 样 执行 脚本 文件 时 ， 将 在 内 存 中 编译 和 执行 ， 打印 出 “3" 作 为 结果 。 没 有 比特 码 文件 生 
成 。 后 文中 (为 了 学 习 和 练习 方便 ) ， 推 荐 使 用 脚本 模式 执行 学 到 的 代码 。 


8.3- 合 名 函数 


在 某 模 块 中 ， 我 们 可 以 用 def/2 宏 定义 函数 ， 用 defp/2 定义 私有 函数 。 用 def/2 CLHH 
数 可 以 被 其 它 模块 中 的 代码 使 用 ， 而 私有 函数 仅 在 定义 它 的 模块 内 使 用 。 


defmodule Math do 
def sum(a, b) do 
do_sum(a, b) 
end 


defp do_sum(a, b) do 
a+b 
end 
end 


Math.sum(1, 2) pan 
Math.do_sum(1, 2) #=> ** (UndefinedFunctionError) 


函数 声明 也 支持 使 用 卫兵 或 多 个 子 句 。 toR-TD BRAGS 4 > Elixirs eey ATA A 
到 找到 一 个 匹配 的 。 下 面 例子 检查 参数 是 否 是 数字 


defmodule Math do 
def zero?(0) do 
true 
end 


def zero?(x) when is_number(x) do 
false 
end 
end 


Math.zero?(0) #=> true 
Math.zero?(1) #=> false 


Math. zero?([1,2,3]) 
#=> ** (FunctionClauseError) 


如 果 没 有 一 个 子 句 能 匹配 参数 ， 会 报错 。 


8.4- 函 数 捕捉 


本 教程 中 提 到 函数 ， 都 是 用 name/arity 的 形 式 描述 这 种 表示 方法 可 以 被 用 来 获取 一 个 命名 
函数 ( 赋 给 一 个 函数 型 变量 ) © 下 面 用 iex 执 行 一 下 上 文 定 义 的 math.exs 文 件 : 


$ iex math.exs 


iex> Math.zero?(0) 

true 

iex> fun = &Math.zero?/1 
&Math.zero?/1 

iex> is_function fun 
true 

iex> fun.(0) 

true 


用 a<function notation> 通过 函数 名 捕捉 一 个 函数 2 它 本 身 代 表 该 函数 值 ( BARA 6940) 9 
它 可 以 不 必 赋 给 一 个 变量 ， 直 接 用 括号 来 使 用 该 函数 。 


本 地 定义 的 ， 或 者 已 导入 的 函数 ， 比 如 is function/1 ， 可 以 不 用 前 级 模 模块 名 : 


iex> &is_function/i 
&:erlang.is_function/1i 
iex> (&is_function/1).(fun) 
taue 


这 种 语法 还 可 以 作为 快捷 方式 来 创建 和 使 用 函数 : 


iex> fun = &(&1 + 1) 
#Function<6.71889879/1 in :erl_eval.expr/5> 
iex> fun.(1) 


代码 中 at 表示 传 给 该 函数 的 第 一 个 参数 。 因此 ，&(&l+1) 其 实 等 同 于 fn x->x+1 end ° # 
创建 短小 函数 时 ， 这 个 很 方便 。 想 要 了 解 更 多 关于 & 捕 提 操 作 符 ， 参 考 Kernel.SpecialForms 
文档 。 


8.5- 默 认 参 数 
Elixir 中 ， 命 名 函数 也 支持 默认 参数 : 


defmodule Concat do 
def join(a, b, sep \\ " ") do 
a <> sep <> b 





end 
end 
I0.puts Concat.join("Hello", "world") #=> Hello world 
I0.puts Concat.join("Hello", "world", "_") #=> Hello_world 


任何 表达 式 都 可 以 作为 默认 参数 ， 但 是 只 在 函数 调用 时 用 到 了 才 被 执行 。 (HR LH > AB 
些 表 达 式 只 是 存在 那儿 ， 不 执行 ; 函数 调用 时 ， 没 有 用 到 黑 认 值 ， 也 不 执行 ) 。 


defmodule DefaultTest do 
def dowork(x \\ I0.puts "hello") do 
x 
end 
end 


iex> DefaultTest.dowork 123 
123) 

iex> DefaultTest.dowork 
hello 

:Ok 


如 果 有 默认 参数 值 的 函数 有 了 多 条 子 句 ， 推 荐 先 定义 一 个 函数 头 (无 具体 函数 体 ) 声明 默认 
参数 : 


defmodule Concat do 
def join(a, b \\ nil, sep \\ " ") 


def join(a, b, _sep) when is_nil(b) do 
a 
end 


def join(a, b, sep) do 
a <> sep <> b 











end 
end 
I0.puts Concat.join("Hello", "world") #=> Hello world 
I0.puts Concat.join("Hello", "world", "_") #=> Hello_world 
I0.puts Concat.join("Hello") #=> Hello 





使 用 默认 值 时 ， 注 意 对 函数 重 载 会 有 一 定 影响 。 考 虑 下 面 例子 : 


defmodule Concat do 
def join(a, b) do 
TO PUES ay ESEE OTN 
a <> b 
end 


def join(a, b, sep \\ " ") do 
IO0.puts "***Second join" 
a <> sep <> b 
end 
end 


如 果 将 以 上 代码 保存 在 文件 "concat.ex" 中 并 编译 ，Elixir 会 报 出 以 下 警告 : 


concat .ex:7: this clause cannot match because a previous clause at line 2 always matches 
al — 


编译 器 是 在 警告 我 们 ， 在 使 用 两 个 参数 调用 join 函数 时 ， 总 使 用 第 一 个 函数 定义 。 只 有 使 
用 三 个 参数 调用 时 ， 才 会 使 用 第 二 个 定义 : 


$ iex concat.exs 


iex> Concat.join "Hello", "world" 

ital Sole orn 

"Helloworld" 

iex> Concat.join "Hello", “world", "_" 
***Second join 

"Hello world" 


后 面 几 章 将 介绍 使 用 命名 函数 来 做 循环 ， 如 何 从 别 的 模块 中 导入 函数 ， 以 及 模块 的 属性 等 。 


9-%% 1/2 


AA Elixir? 〈 或 所 有 函数 式 语 言 中 ) ， 数 据 有 不 变性 (immutability) ， 因 此 在 写 循 环 时 与 
传统 的 命令 式 (imperative) 语言 有 所 不 同 。 例如 某 命 令 式 语言 的 循环 可 以 这 么 写 : 


for(i = 0; i < array.length; i++) { 
array[i] = array[i] * 2 


上 面 例 子 中 ， 我 们 改变 了 array ， 以 及 辅助 变量 i 的 值 。 这 在 Elixir 中 是 不 可 能 的 。 尽管 如 
此 ， 函 数 式 语言 却 依赖 于 某 种 形式 的 循环 --- 递 归 : 一 个 函数 可 以 不 断 地 被 递归 调用 ， 直 到 某 
条 件 满足 才 停止 。 考虑 下 面 的 例子 : 打印 一 个 字符 串 若干 次 : 


defmodule Recursion do 
def print_multiple_times(msg, n) when n <= 1 do 
I0.puts msg 
end 


def print_multiple_times(msg, n) do 
IO0.puts msg 
print_multiple_times(msg, n - 1) 
end 
end 
Recursion.print_multiple_times("Hello!", 3) 
# Hello! 
# Hello! 
# Hello! 


一 个 函数 可 以 有 许多 子 钉 (上面 看 起 来 定义 了 两 个 函数 ， 但 卫兵 条 件 不 同 ， 可 以 看 作 同 一 个 
HARYANA) 。 当 参 数 匹配 该 子 句 的 模式 ， 且 该 子 句 的 卫兵 表达 式 返 回 true， 才 会 执行 
该 子 名 内 容 。 上面 例 子 中 ， 当 print_multiple_times/2 第 一 次 调用 时 > nA) 4H 223 © 


第 一 个 子 名 有 卫兵 表达 式 要 求 n 必 须 小 于 等 于 1 。 因 为 不 满足 此 条 件 ， 代 码 找 该 函数 的 下 一 条 
Fao 

参数 匹配 第 二 个 子 句 ， 且 该 子 句 也 没有 卫兵 表达 式 ， 因 此 得 以 执行 。 首 先 打 印 msg ， 然 后 调 
用 自身 并 传递 第 二 个 参数 n-1 (=2)。 RH msg 又 被 打印 一 次 ， 之 后 调用 自身 并 传递 参 

数 n-1 (=1) ° 


这 个 时 候 ，n 满 足 第 一 个 函数 子 名 条件。 遂 执 行 该 子 句 ， 打 印 msg ， 然 后 就 此 结 


我 们 称 例子 中 第 一 个 亟 数 子 句 这 种 子 句 为 “基本 情形 "。 基 本 情形 总 是 最 后 被 执行 ， 因 为 起 初 
通常 都 不 匹配 执行 条 件 ， 程 序 而 转 去 执行 其 它 子 句 。 但是， 每 执行 一 次 其 它 子 句 ， 条 件 都 向 
这 基本 情形 靠拢 一 点 ， 直 到 最 终 回 到 基本 情形 处 执行 代码 。 


下 面 我 们 使 用 递归 的 威力 来 计算 列表 元 素 求 和 : 


defmodule Math do 
def sum_list([head|tail], accumulator) do 
sum_list(tail, head + accumulator) 
end 


def sum_list([], accumulator) do 
accumulator 
end 
end 


Math.sum_list([1, 2, 3], ©) #=> 6 


我 们 首先 用 列表 [1,2,3] 和 初 值 0 作 为 参数 调用 函数 ， 程 序 将 逐个 匹配 各 子 名 的 条 件 ， 执 行 第 一 
个 符合 要 求 的 子 句 。 于 是 ， 参 数 首 先 满足 例子 中 定义 的 第 一 个 子 句 。 参 数 匹配 使 得 head = 
1 > tail = [2,3] > accumulator = 0 ° 


然后 执行 该 字 据 内 容 ， 把 head + accumulator 作 为 第 二 个 参数 ， 连 带 去 掉 了 head 的 列表 做 第 
一 个 参数 ， 再 次 调用 函数 本 身 。 如 此 循环 ， 每 次 都 把 新 传 入 的 列表 的 head 加 到 accumulator 
上 ， 传 递 去 掉 了 head 的 列表 。 最 终 传 递 的 列表 为 空 ， 符 合 第 二 个 子 名 的 条 件 ， 执 行 该 子 句 ， 
返回 accumulator 的 值 6。 


几 次 函数 调用 情况 如 下 : 


sum_list [1, 2, 3], 9 
sum_list [2, 3], 1 
sum_list [3], 3 
sum_list [], 6 


这 种 使 用 列表 做 参数 ， 每 次 削减 一 点 列表 的 递归 方式 ， 称 为 "递减 "算法 ， 是 函数 式 编程 的 核 


如 果 我 们 想 给 每 个 列表 元 素 加 倍 呢 ? : 


defmodule Math do 
def double_each([head|tail]) do 
[head * 2| double_each(tail) ] 
end 


def double_each([]) do 


Math.double_each([1, 2, 3]) #=> [2, 4, 6] 
此 处 使 用 了 递归 来 遍历 列表 元 素 ， 使 它们 加 倍 ， 然 后 返回 新 的 列表 。 这 样 以 列表 为 参数 ， 递 
归 处 理 其 每 个 元 素 的 方式 ， 称 为 “映射 (map) "算法 。 


递归 和 列 尾 调用 优化 (tail call optimization) 是 Elixir 中 重要 的 部 分 ， 通 常用 来 创建 循环 。 K 
管 如 此 ， 在 Elixir 中 你 很 少 会 使 用 以 上 方式 来 递归 地 处 理 列表 。 


下 一 章 要 介绍 的 Enum 模 块 为 操作 列表 提供 了 诸多 方便 。 比如 ， 下 面 例子 : 


iex> Enum.reduce([1, 2, 3], ©, fn(x, acc) -> x + acc end) 
6 

iex> Enum.map([1, 2, 3], fn(x) -> x * 2 end) 

[2, 4, 6] 


或 者 ， 使 用 捕捉 的 语法 : 


iex> Enum.reduce([1, 2, 3], 0, &+/2) 
6 

iex> Enum.map([1, 2, 3], &(&1 * 2)) 
[2, 4, 6] 


EST 
积极 VS 懒 情 


wu 


10.1- 枚 举 类 型 


Elixir 提 供 了 枚 举 类 型 (enumerables) 的 概念 ， 使 用 Enum 模 块 操作 它们 。 我 们 已 经 介绍 过 两 
种 枚 举 类 型 : 列表 和 图 。 


iex> Enum.map([1, 2, 3], fn x -> x * 2 end) 

[2, 4, 6] 

iex> Enum.map(%{1 => 2, 3 => 4}, fn {k, v} -> k * v end) 
[2, 12] 


Enum 模 块 为 枚 举 类 型 提供 了 大 量 函 数 来 变化 ， 排 序 ， 分 组 ， 过 滤 和 读 取 元 素 。Enum 模 块 是 
开发 者 最 常用 的 模块 之 一 。 


Elixir 还 提供 了 范围 (range) 


iex> Enum.map(1..3, fn x -> x * 2 end) 


[2, 4, 6] 
iex> Enum.reduce(1..3, 0, &+/2) 
6 


因为 Enum 模 块 在 设计 时 为 了 适用 于 不 同 的 数据 类 型 ， 所 以 它 的 API 被 限制 为 多 数据 类 型 适用 
的 函数 。 为 了 实现 某 些 操作 ， 你 可 能 需要 针对 某 类 型 使 用 某 特 定 的 模块 。 比如 ， 如 果 你 要 在 
列表 中 某 特定 位 置 插入 一 个 元 素 ， 要 用 List 模 块 中 的 List.insert_at/3 函 数 。 而 向 某 些 类 型 内 插 
入 数据 是 没 意 义 的 ， 比 如 范围 。 


Enum 中 的 函数 是 多 态 的 ， 因 为 它们 能 处 理 不 同 的 数据 类 型 。 尤其 是 ， 模 块 中 可 以 适用 于 不 同 
数据 类 型 的 函数 ， 它 们 是 遵循 了 Enumerable 协 议 。 我 们 在 后 面 章节 中 将 讨论 这 个 协议 。 下 面 
将 介绍 一 种 特殊 的 枚 举 类 型 : 流 。 


10.2-42 vs W 


Enum 模 块 中 的 所 有 函数 都 是 积极 的 。 多 数 函 数 接受 一 个 枚 举 类 型 ， 并 返回 一 个 列表 : 


iex> odd? = &(rem(&1, 2) != 0) 
#Function<6.80484245/1 in :erl_eval.expr/5> 
iex> Enum.filter(1..3, odd?) 

[1, 3] 


这 意味 着 当 使 用 Enum 进 行 多 种 操作 时 ， 每 次 操作 都 生成 一 个 中 间 列 表 ， 直 到 得 出 最 终结 果 : 


iex> 1..100_000 |> Enum.map(&(&1 * 3)) |> Enum.filter(odd?) |> Enum.sum 
7500000000 


上 面 例子 是 一 个 含有 多 个 操作 的 管道 。 从 一 个 范围 开始 ， 然 后 给 每 个 元 素来 以 3。 该 操作 将 会 
生成 的 中 间 结 果 是 含有 100000 个 元 素 的 列表 。 然后 我 们 过 滤 掉 所 有 偶数 ， 产 生 又 一 个 新 中 间 
结果 : 一 个 50000 元 素 的 列表 。 REKFe > ROAR 


WW. 
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作为 一 个 替代 ， 流 模块 提供 了 懒惰 的 实现 : 


iex> 1..100_000 |> Stream.map(&(&1 * 3)) |> Stream.filter(odd?) |> Enum.sum 
7500000000 


与 之 前 Enum 的 处 理 不 同 ， 流 先 创建 了 一 系列 的 计算 操作 。 然 后 仅 当 我 们 把 它 传 递 给 Enum 模 
块 ， 它 才 会 被 调用 。 流 这 种 方式 适用 于 处 理 大 量 的 (甚至 是 无 限 的 ) 数据 集合 。 
10.3- 流 

流 是 懒惰 的 ， 比 起 Enum 来 说 。 分 步 分 析 一 下 上 面 的 例子 ， 你 会 发 现 流 与 Enum 的 区 别 : 


iex> 1..100_000 |> Stream.map(&(&1 * 3)) 
#Stream<[enum: 1..100000, funs: [#Function<34.16982430/1 in Stream.map/2>]]> 


流 操作 返回 的 不 是 结果 列表 ， 而 是 一 个 数据 类 型 --- 流 ， 一 个 表示 要 对 范围 1..100000 使 用 map 
操作 的 动作 。 
另外 ， 当 我 们 用 管道 连接 多 个 流 操 作 时 : 


iex> 1..100_000 |> Stream.map(&(&1 * 3)) |> Stream.filter(odd?) 
#Stream<[enum: 1..100000, funs: [...]]> 


流 模块 中 的 函数 接受 任何 枚 举 类 型 为 参数 ， 返 回 一 个 流 。 流 模块 还 提供 了 创建 流 (甚至 是 无 
限 操作 的 流 ) 的 函数 。 例如 ， stream.cycle/1 可 以 用 来 创建 一 个 流 ， 它 能 无 限 周期 性 枚 举 所 
提供 的 参数 (小心 使 用 ) 


iex> stream = Stream.cycle([1, 2, 3]) 
#Function<15.16982430/2 in Stream.cycle/1> 
iex> Enum.take(stream, 10) 

[192 S iy Aa ae y 2 S fl 


另 一 方面 ， stream.unfold/2 函数 可 以 生成 给 定 的 有 限 值 : 


iex> stream = Stream.unfold("hetto", &String.next_codepoint/1) 
#Function<39.75994740/2 in Stream.unfold/2> 

iex> Enum.take(stream, 3) 

Leahey, ele ze] 


另 一 个 有 趣 的 函数 是 Stream.resource/3 ， 它 可 以 用 来 包 庄 某 资 源 ， 确 保 该 资源 在 使 用 前 打 
开 ， 在 用 完 后 关闭 (即使 中 途 出 现 错误 ) 。-- 类 似 C# 中 的 Usef} 关 键 字 。 比 如 ， 我 们 可 以 
stream 一 个 文件 : 


iex> stream = File.stream! ("path/to/file") 
#Function<18.16982430/2 in Stream.resource/3> 
iex> Enum.take(stream, 10) 


这 个 例子 读 取 了 文件 的 前 10 行 内 容 。 流 在 处 理 大 文件 ， 或 者 慢 速 资源 (如 网 络 ) 时 非常 有 
用 。 


一 开始 Enum 和 流 模 块 中 函数 的 数量 多 到 让 人 气 侯 。 但 你 会 慢 慢 地 熟悉 它们 。 ENARA 
Enum 模 块 ， 然 后 因为 应 用 而 转 去 流 模块 中 那些 相应 的 ， 懒 情 版 的 函数 。 


进程 
Elixir 中 ， 所 有 代码 都 在 进程 中 执行 。 进 程 彼此 独立 ， 一 个 接 一 个 并 发 执行 ， 彼 此 通过 消息 传 
递 来 沟通 。 进程 不 仅仅 是 Elixir 中 并 发 的 基础 ， 也 是 Elixir 创 建 分 布 式 、 高 容错 程序 的 本 质 。 


Elixir 的 进程 和 操作 系统 中 的 进程 不 可 混为一谈 。 Elixir 的 进程 ， 在 CPU 和 内 存 使 用 上 ， 是 极度 
轻 量 级 的 (不 同 于 其 它 语 言 中 的 线程 ) 。 因此 ， 同 时 运行 着 数 十 万 、 百 万 个 进程 也 并 不 是 军 
见 的 事 。 


本 章 将 讲解 如 何 派生 新 进程 ， 以 及 在 进程 间 如 何 发 送 和 接受 消息 等 基本 知识 。 


11.1- 进 程 派 生 


IRA (spawning) 一 个 新 进程 的 方法 是 使 用 自动 导入 〈kernel 函 数 ) 的 spawn/1 WA: 


iex> spawn fn -> 1 + 2 end 
#PID<O@.43.0> 


函数 spawn/1 接收 一 个 函数 作为 参数 ， 在 其 派生 出 的 进程 中 执行 这 个 函数 。 
注意 spawn/1 返 回 一 个 PID (进程 标识 ) 。 在 这 个 时 候 ， 这 个 派生 的 进程 很 可 能 已 经 结束 。 派 
生 的 进程 执行 完 函 数 后 便 会 结束 : 


iex> pid = spawn fn -> 1 + 2 end 
#PID<0.44.0> 

iex> Process.alive?(pid) 

false 


你 可 能 会 得 到 与 例子 中 不 一 样 的 PID 


用 self/o 函数 获取 当前 进程 的 PID : 


iex> self() 

#PID<0.41.0> 

iex> Process.alive?(self()) 
true 


注 : 上 文 调用 sete 加 了 括号 。 但 是 如 前 文 所 说 ， 在 不 引起 误解 的 情况 下 ， 可 以 省 略 
括号 而 只 写 self 


可 以 发 送 和 接收 消息 ， 让 进程 变 得 越 来 越 有 趣 。 


11.2- 发 送 和 接收 


使 用 send/2 函数 发 送 消息 ， 用 receive/1 接收 消息 : 


iex> send self(), {:hello, "world"} 
{:hello, "world"} 
iex> receive do 
> {:hello, msg} -> msg 
Ta {:world, msg} -> "won't match" 
eend 
"world" 


当 有 消息 被 发 给 某 进 程 ， 该 消息 就 被 存储 在 该 进程 的 邮箱 里 。 1B receives’ 检查 当前 进 
程 的 邮箱 ， 了 寻找 匹 配给 定 模式 的 消息 。 其 中 函数 receive/1 LADATA’ 4° case/2 。 当 
然 也 可 以 给 子 句 加 上 卫兵 表达 式 。 


如 果 找 不 到 匹配 的 消息 ， 当 前 进程 将 一 直 等 待 ， 知 道 下 一 条 信息 到 达 。 但 是 可 以 设置 一 个 超 
时 时 间 : 


iex> receive do 
> {:hello, msg} -> msg 
..> after 
> 1_000 -> "nothing after is" 
..> end 
"nothing after is" 


超时 时 间 设 为 0 表示 你 知道 当前 邮箱 内 肯定 有 邮件 存在 ， 很 自信 ， 因 此 设 了 这 个 极 短 的 超时 时 
间 。 


把 以 上 概念 综合 起 来 ， 演 示 进 程 间 发 送 消息 : 


iex> parent = self() 

#PID<0.41.0> 

iex> spawn fn -> send(parent, {:hello, self()}) end 

#PID<O.48.0> 

iex> receive do 
ane {:hello, pid} -> "Got hello from #{inspect pid}" 
..> end 

"Got hello from #PID<0.48.0>" 


在 shell 中 执行 程序 时 ， 辅 助 函 数 flush/9 很 有 用 。 它 清空 缓冲 区 ， 打 印 进程 邮箱 中 的 所 有 消 
a: 


we 


iex> send self(), :hello 
:hello 

iex> flush() 

:hello 

:Ok 
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Elixir 中 有 最 常用 的 进程 派生 方式 是 通过 函数 spawn_link/1 。 在 举例 子 讲解 spawn_link/1 之 
前 ， 来 看 看 如 果 一 个 进程 失败 了 会 发 生 什么 


iex> spawn fn -> raise "oops" end 
#PID<0.58.0> 


。。。 哈 也 没 发 生 。 这 时 因为 进程 都 是 互 不 干扰 的 。 如 果 我 们 希望 一 个 进程 中 发 生 失 败 可 以 
被 另 一 个 进程 知道 ， 我 们 需要 链接 它们 。 使 用 spawn_link/1 函数 ， 例 子 : 


iex> spawn_link fn -> raise "oops" end 
#PID<O.60.0> 
** (EXIT from #PID<0.41.0>) an exception was raised: 
** (RuntimeError) oops 
:erlang.apply/2 


当 失 败 发 生 在 shell 中 ，shell 会 自动 终止 执行 ， 并 显示 失败 信息 。 这 导致 我 们 没 法 看 清 背后 
程 。 要 弄 明 白 链接 的 进程 在 失败 时 发 生 了 什么 ， 我 们 在 一 个 脚本 文件 使 用 spawn_link/1 
执行 和 观察 它 : 

# spawn.exs 

spawn_link fn -> raise "oops" end 


receive do 
:hello -> "let's wait until the process fails" 


end 
这 次 ， 该 进程 在 失败 时 把 它 的 父 进 程 也 弄 停 止 了 ， 因 为 它们 是 链接 的 。 
手动 链接 进程 : Process.link/1 ° 建议 可 以 多 看 看 Process 模 块 > Ew 包含 很 多 常用 的 进程 


操作 函数 。 


进程 和 链接 在 创建 能 高 容错 系统 时 扮演 重要 角色 。 在 Elixir 程 序 中 ， 我 们 经 常 把 进程 链接 到 
某 “管理 者 "上 。 由 这 个 角色 负责 检测 失败 进程 ， 并 且 创 建新 进程 取代 之 。 因 为 进程 间 独 立 ， 
默认 情况 下 不 共享 任何 东西 。 而 且 当 一 个 进程 失败 了 ， 也 不 会 影响 其 它 进程 。 因 此 这 种 形式 
(进程 链接 到 “管理 者 "角色 ) 是 唯一 的 实现 方法 。 


其 它 语言 通常 需要 我 们 来 try-catch 异 常 ， 而 在 Elixir 中 我 们 对 此 无 所 谓 ， 放 手 任 进程 挂 掉 。 A 
为 我 们 希望 “管理 者 "会 以 更 合适 的 方式 重启 系统 。“ 要 死 你 就 快 一 点 "是 Elixir 软 件 开发 的 通用 哲 


学 o 
在 讲 下 一 章 之 前 ， 让 我 们 来 看 一 个 Elixir 中 常见 的 创建 进程 的 情形 
11.4- 状 态 


目前 为 止 我 们 还 没有 怎么 谈 到 状态 。 人 但是， 只 要 你 创 pane) ， 就 需要 状态 。 例 如 ， 保 存 程序 
的 配置 信息 ， 或 者 分 析 一 个 文件 先 把 它 保存 在 内 存 里 。 你 怎么 存储 状态 ? 


进程 就 是 (最 常见 的 ) 答案 。 我 们 可 以 写 无 限 循 环 的 进程 ， 保 存 一 个 状态 ， 然 后 通过 收发 信 
息 来 告知 或 改变 该 状态 。 例 如 ， 写 一 个 模块 文件 ， 用 来 创建 一 个 提供 k-v 仓 储 服务 的 进程 : 


defmodule KV do 
def start do 
{:ok, spawn_link(fn -> loop(%{}) end)} 
end 


defp loop(map) do 
receive do 
{:get, key, caller} -> 
send caller, Map.get(map, key) 
loop(map) 
{:put, key, value} -> 
loop(Map.put(map, key, value)) 
end 
end 
end 


注意 start 函数 简单 地 派生 一 个 新 进程 ， 这 个 进程 以 一 个 空 的 图 为 参数 ， 执 行 loop/1 函数 。 
这 个 loop/1 函数 等 待 消 息 ， 并 且 针 对 每 个 消息 执行 合适 的 操作 。 加 入 受到 一 个 :get 消息 
它 把 消息 发 回 给 调用 者 ， 然 后 再 次 调用 自身 loop/1 ? 3 apn hey eat ae 
用 一 个 新 版 本 的 图 变量 (里面 的 k-v 更 新 了 ) 再 次 调用 自身 。 


执行 一 下 试 试 : 


iex> {:ok, pid} = KV.start 
#PID<0.62.0> 

iex> send pid, {: get, :hello, self()} 
{:get, :hello, #PID<0.41.0>} 

iex> flush 

nil 


一 开始 进程 内 的 图 变量 是 没有 键 值 的 ， 所 以 发 送 一 个 :get 消息 并 且 刷 新 当前 进程 的 收 件 箱 ， 
返回 nil。 oe :put 消息 : 


iex> send pid, {:put, :hello, :world} 
#PID<0.62.0> 

iex> send pid, {:get, :hello, self()} 
{:get, :hello, #PID<0.41.0>} 

iex> flush 

:world 


注意 进程 是 怎么 保持 一 个 状态 的 : 我 们 通过 同 该 进程 收发 消息 来 获取 和 更 新 这 个 状态 。 事实 
上 ， 任 何 进程 只 要 知道 该 进程 的 PID， 都 能 读 取 和 修改 状态 。 


还 可 以 注册 这 个 PID， 给 它 一 个 名 称 。 这 使 得 人 人 都 知道 它 的 名 字 ， 并 通过 名 字 来 向 它 发 送 消 
a: 


woes 


iex> Process.register(pid, :kv) 

Enue 

iex> send :kv, {:get, :hello, self()} 
{:get, :hello, #PID<0.41.0>} 

iex> flush 

:world 


使 用 进程 维护 状态 ， 以 及 注册 进程 都 是 Elixir 程 序 非常 常用 的 方式 。 但 是 大 多 数 时 间 我 们 不 会 
自己 实现 ， 而 是 使 用 Elixir 提 供 的 抽象 实现 。 例如 ，Elixir 提 供 的 agent 就 是 一 种 维护 状态 的 简 
单 的 抽象 实现 : 


iex> {:ok, pid} = Agent.start_link(fn -> %{} end) 

{:ok, #PID<0.72.0>} 

iex> Agent.update(pid, fn map -> Map.put(map, :hello, :world) end) 
:Ok 

iex> Agent.get(pid, fn map -> Map.get(map, :hello) end) 

:world 


给 agent.start/2 方法 加 一 个 一 个 :name 选项 可 以 自动 为 其 注册 一 个 名 字 。 MT agents’ 
Elixir 还 提供 了 创建 通用 服务 器 (generic servers， 称 作 GenServer) 、 通 用 时 间 管 理 器 以 及 
事件 处 理 器 (又 称 GenEvent) 的 API。 这 些 ， 连 同 “ 管 理 者 " 树 ， 都 可 以 在 Mix 和 OTP 手 册 里 找 
到 详细 说 明 。 
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MO 模块 

文件 模块 

路 径 模 块 
进程 和 组 长 
iodata 和 chardata 


本 章 简 单 介 绍 Elixir 的 输入 、 输 出 机 制 以 及 相关 的 模块 ， 如 |O 〇 ， 文 件 和 路 径 。 


现在 介绍 IJO 似 乎 有 点 早 ， 但 是 MO 系统 可 以 让 我 们 一 宕 Elixir 哲 学 ， 满 足 我 们 对 该 语言 以 及 VM 
的 好 奇 心 。 


12.1-IO 模 块 


IO 模块 是 Elixir 语 言 中 读 写 标 准 输入 、 输 出、 标准 错误 、 文 件 、 设 备 的 主要 机 制 。 使 用 该 模块 
的 方法 颇 为 直接 : 


iex> I10.puts "hello world" 
"hello world" 

:Ok 

iex> I10.gets "yes or no? " 
yes or no? yes 

"yes\n" 


IO 模块 中 的 函数 默认 使 用 标准 输入 输出 。 我 们 也 可 以 传递 stderr 来 指示 将 错误 信息 写 到 标 
准 错误 设 备 上 : 


iex> I10.puts :stderr, "hello world" 
"hello world" 
:OK 


12.2- 文 件 模块 


文件 模块 包含 了 可 以 让 我 们 读 写 文件 的 函数 。 默 认 情 况 下 文件 是 以 二 进 制 模式 打开 ， 它 要 求 
程序 员 使 用 特殊 的 I0.binread/2 和 I0.binwrite/2 MARES LH: 


iex> {:ok, file} = File.open "hello", [:write] 
{:ok, #PID<0.47.0>} 

iex> [0.binwrite file, "world" 

:ok 

iex> File.close file 

:ok 

iex> File.read "hello" 

{:ok, "world"} 


文件 可 以 使 用 :utf8 编码 打开 ， 然 后 就 可 以 被 ID 模块 中 其 他 函数 使 用 了 : 


iex> {:ok, file} = File.open "another", [:write, :utf8] 
{:ok, #PID<0.48.0>} 


除了 打开 、 读 写 文 件 的 函数 ， 文 件 模 块 还 有 许多 函数 来 操作 文件 系统 。 这 些 函 数 根据 Unix 功 
能 相对 应 的 命令 命名 。 如 File.rm/1 ee 除 文件 ; File.mkdir/1 用 来 创建 目 

录 ; File.mkdir_p/1 创建 目录 并 保证 其 父 目 录 一 并 创建 ; 还 

有 File.cp_r/2 和 File.rm rf/2 用 来 递归 地 复制 和 删除 整个 目录 。 


你 还 会 注意 到 文件 模块 中 ， 一 般 函 数 都 有 一 个 名 称 类 似 的 版 本 。 区 别 是 名 称 上 一 个 有 !(bang) 
一 个 没有 。 例如 ， 上 面 的 例子 我 们 在 读 取 “hello" 文 件 时 ， 用 的 是 不 带 ! 号 的 版 本 。 下 面 用 例子 
演示 下 它们 的 区 别 : 

iex> File.read "hello" 

{:ok, "world"} 

iex> File.read! "hello" 

"world" 

iex> File.read "unknown" 

{:error, :enoent} 


iex> File.read! "unknown" 
** (File.Error) could not read file unknown: no such file or directory 


注意 看 ， 当 文件 不 存在 时 ， 带 ! 号 的 版 本 会 报错 。 就 是 说 不 带 ! 号 的 版 本 能 照顾 到 模式 匹配 出 来 
的 不 同情 况 。 但 有 的 时 候 ， 你 就 是 希望 文件 在 那儿 ，! 使 得 它 能 报 出 有 意义 的 错误 。 


因此 ， 不 要 写 
{:ok, body} = File.read(file) 
相反 地 ， 应 该 这 么 写 : 


case File.read(file) do 
{:ok, body} -> # handle ok 
{:error, r} -> # handle error 
end 


或 者 


File.read! (file) 


12.3- 路 径 模 块 


文件 模块 中 绝 大 多 数 函 数 都 以 路 径 作为 参数 。 通 常 这 些 路 径 都 是 二 进 制 ， 可 以 被 路 径 模块 提 
供 的 函数 操作 : 


iex> Path.join("foo", "bar") 
"Foo/bar" 

iex> Path.expand("~/hello") 
"/Users/jose/hello" 


ALT VA E53 4 UDR Re HH KAT CAA A RATAA ORN © 下 面 将 讨论 1/O 
模块 中 令 人 好 奇 的 高 级 话题 。 这 部 分 不 是 写 Elixir 程 序 必 须 掌 握 的 ， 可 以 跳 过 不 看 。 但 是 如 果 
你 大 概 地 浏览 一 下 ， 可 以 了 解 1D 是 如 何在 VM 上 实现 以 及 其 它 一 些 有 趣 的 内 容 。 


12.4- 进 程 和 组 长 
你 可 能 已 经 发 现 ， File.open/2 函数 返回 了 一 个 包含 PID 的 元 祖 : 


iex> {:ok, file} = File.open "hello", [:write] 
{:ok, #PID<0.47.0>} 


IO 模块 实际 上 是 同 进程 协同 工作 的 。 当 你 调用 to.write(pid, binary) 时 ，1/O 模 块 将 发 送 一 
条 消息 给 执行 操作 的 进程 。 让 我 们 用 自己 的 代码 表述 下 这 个 过 程 : 


iex> pid = spawn fn -> 

..> receive do: (msg -> I0.inspect msg) 

enc 

#PID<0.57.0> 

iex> I10.write(pid, "hello") 

{:io_request, #PID<0.41.0>, #PID<0.57.0>, {:put_chars, :unicode, "hello"}} 
** (ErlangError) erlang error: :terminated 


调用 lo.write/2 之 后 ， 可 以 看 见 打 印 出 了 发 给 IO 模块 的 请 求 。 然而 因为 我 们 没有 提供 某 些 东 
西 ， 这 个 请 求 失败 了 。 


StringlO 模 块 提供 了 一 个 基于 字符 串 的 ID 实现 : 


iex> {:ok, pid} = StringI0O.open("hello") 
{:ok, #PID<0.43.0>} 

iex> I0.read(pid, 2) 

"he! 


Erlang 虚 拟 机 用 进程 给 IO 设备 建 模 ， 允 许 同 一 个 网 络 中 的 不 同 节点 通过 交换 文件 进程 ， 实 现 
节点 间 的 文件 读 写 。 在 所 有 IO 设备 之 中 ， 有 一 个 特殊 的 进程 ， 称 作 组 长 (group leader) 。 


当 你 写 东 西 到 标准 输出 ， 实 际 上 是 发 送 了 一 条 消息 给 组 长 ， 它 把 内 容 写 给 STDIO 文 件 表述 
者 : 


iex> I0.puts :stdio, "hello" 

hello 

:Ok 

iex> I0.puts Process.group_leader, "hello" 
hello 

:OK 


组 长 可 为 每 个 进程 做 相应 配置 ， CO 
能 保证 远程 机 器 的 消息 可 以 被 重 定向 到 发 起 操作 的 终端 


12.5-iodata 和 chardata 


在 以 上 所 有 例子 中 ， 我 们 都 用 的 是 二 进 制 /字符 串 方式 读 写 文件 。 在 "二进制 、 字 符 囊 和 字符 列 
表 " 那 章 里 ， 我 们 注意 到 字符 串 就 是 普通 的 bytes ， 而 字符 列表 是 code a (字符 码 ) 的 列 
表 。 


I/O 模 块 和 文件 模块 中 的 函数 接受 列表 作为 参数 。 还 可 以 接受 混合 类 型 的 列表 ， 里 面 内 容 是 整 
形 、 二 进 制 都 行 : 

iex> I10.puts ‘hello world' 

hello world 

:Ok 

iex> I10.puts ['hello', ?\s, "world"] 


hello world 
:Ok 


尽管 如 此 ， 有 些 地 方 还 是 要 注意 。 一 个 列表 可 能 表示 一 串 byte， 或 者 一 串 字 符 。 用 哪 一 种 需 
要 看 |/ 〇 设备 是 怎么 编码 的 。 


如 果 不 指明 编码 ， 文 件 就 以 [raw 模式 打 开 ， 这 时 候 只 能 用 文件 模块 里 bin 开 头 (二 进 制版 ) 的 
函数 对 其 进行 操作 。 这 些 函 数 接受 iodata* 作 为 参数 ， 即 ， 它 们 期 待 一 个 整数 值 的 列表 ， 用 来 
表示 byte 或 二 进 制 


尽管 只 是 细微 的 差别 ， 如 果 你 打算 传递 列表 给 那些 函数 ， 你 需要 考虑 那些 细节 。 底层 的 bytes 
ery ， 这 种 表示 就 是 raW 的 。 


13- 别 名 和 代码 引用 


别名 
require 
import 
别名 机 制 
RE 


为 了 实现 软件 重用 ，Elixir 提 供 了 三 种 指令 (directives) 。 之 所 以 称 之 为 “指令 *， 是 因为 它们 
的 作用 域 是 词法 作用 域 (lexicla scope) 。 


13.1- 别 名 


宏 alias 可 以 为 任何 模块 名 设置 别名 。 想象 一 下 Math 模 块 ， 它 针对 特殊 的 数学 运算 使 用 了 特 
殊 的 列表 实现 : 


defmodule Math do 
alias Math.List, as: List 
end 


现在 ， 任 何 对 List 的 引用 将 被 自动 变 成 对 Math.List 的 引用 。 如 果 还 想 访 问 原来 的 List ， 
需要 前 组 'Elixir : 


List.flatten #=> uses Math.List.flatten 
Elixir.List.flatten #=> uses List.flatten 
Elixir.Math.List.flatten #=> uses Math.List.flatten 


Elixir 中 定义 的 所 有 模块 都 在 一 个 主 Elixir 命 名 空间 。 但 是 为 方便 起 见 ， 我 们 平时 都 不 再 前 
面 加 'EIlixir' ° 


别名 常 被 使 用 于 定义 快捷 方式 。 实 际 上 不 带 as 选项 去 调用 alias 会 自动 将 这 个 别名 设置 为 
模块 名 的 最 后 一 部 分 : 


alias Math.List 
就 相当 于 : 


alias Math.List, as: List 


注意 ， 别 名 是 词法 作用 域 。 即 ， 你 在 菜 个 函数 中 设置 别名 : 


defmodule Math do 
def plus(a, b) do 
alias Math.List 
end 


def minus(a, b) do 


end 
end 


例子 中 alias 指令 只 在 函数 plus/2 中 有 用 > minus/2 不 受 影响 。 


13.2-require 


Elixir 提 供 了 许多 宏 ， 用 于 元 编程 ( 写 能 生成 代码 的 代码 ) o 


宏 也 是 一 堆 代码 ， 但 它 在 编译 时 被 展开 和 执行 。 就 是 说 为 了 使 用 一 个 宏 ， 你 需要 确保 它 定义 
的 模块 和 实现 在 编译 期 时 可 用 。 


要 使 用 宏 ， 需 要 用 require 指令 引入 定义 宏 的 模块 : 


iex> Integer .odd?(3) 

** (CompileError) iex:1: you must require Integer before invoking the macro Integer .odd?/ 
iex> require Integer 

nil 

iex> Integer .odd?(3) 

true 


二 | 


Elixir? > tnteger.odd?/1 哆 数 被 定义 为 一 个 宏 ， 它 可 以 被 当 作 卫兵 表达 式 (guards) 使 用 。 
为 了 调用 这 个 宏 ， 首 先 得 用 require 引用 了 /nteger 模 块 。 


总 的 来 说 ， 宏 在 被 用 到 之 前 不 需要 早早 被 require 引 用 进来 ， 除 非 我 们 想 让 这 个 宏 在 整个 模块 
中 可 用 。 尝试 调用 一 个 没有 引入 的 宏 会 导致 报错 。 注意 ， 像 alias 指令 一 样 ，require 也 是 
词法 作用 域 的 。 下 文中 我 们 会 进一步 讨论 宏 。 


13.3-import 


当 想 轻松 地 访问 别 的 模块 中 的 函数 和 宏 时 ， 可 以 使 用 import 指令 加 上 宏 定 义 模块 的 完整 名 
Fo 例如 ， 如 果 我 们 想 多 次 使 用 List 模 块 中 的 duplicate 函数 ， 我 们 可 以 这 么 import 它 : 


iex> import List, only: [duplicate: 2] 
nil 

iex> duplicate :ok, 3 

[:ok, :ok, :ok] 


这 个 例子 中 ， 我 们 只 从 List 模 块 导 入 了 函数 duplicate/2 。 尽管 only: 选项 是 可 选 的， 但 是 推 
荐 使 用 。 

除了 only: 选项 ， 还 有 except: 选项 。 使 用 选项 only: ， 还 可 以 传递 给 

È macros 或 :functions ° 如 下 面 例 子 ， 程 序 仅 导入 Integer 模 块 中 所 有 的 宏 : 


import Integer, only: :macros 


或 者 ， 仅 导入 所 有 的 函数 : 


import Integer, only: :functions 


注意 ， import 也 是 词法 作用 域 ， 意 味 着 我 们 可 以 在 某 特定 函数 中 导入 宏 或 方法 : 


defmodule Math do 
def some_function do 
import List, only: [duplicate: 2] 
# call duplicate 
end 
end 


在 此 例子 中 ， 导 入 的 函数 List.duplicate/2 只 在 那个 函数 中 可 见 。 该 模块 的 其 它 函 数 中 都 不 
可 用 (自然 ， 别 的 模块 也 不 受 影响 ) 。 


注意 ， 若 import 一 个 模块 ， 将 自动 require 它 。 


13.4- 别 名 机 制 


讲 到 这 里 你 会 问 ，Elixir 的 别名 到 底 是 什么 ， 它 是 怎么 实现 的 ? 


Elixir 中 的 别名 是 以 大 写字 母 开头 的 标识 符 〈 像 String, Keyword 等 等 ) ， 在 编译 时 会 被 转换 为 
原子 。 例 如 ， 别 名 'String' 会 被 转换 为 :"Elixir.Sstring" 


iex> is_atom(String) 
true 

iex> to_string(String) 
"Elixir.String" 

iex> :"Elixir.String" 
String 


使 用 alias/2 指令 ， 其 实 只 是 简单 地 改变 了 这 个 别名 将 要 转换 的 结果 。 


别名 如 此 这 般 工作 ， 是 因为 在 Erlang 虚 拟 机 中 (以 及 上 面 的 Elixir) ， 模 块 名 是 被 表述 成 原子 
的 。 例 如 ， 我 们 调用 一 个 Erlang 模 块 的 机 制 是 : 


iex> :lists.flatten([1,[2],3]) 
[1, 2, 3] 


这 也 是 允许 我 们 动态 调用 模块 函数 的 机 制 : 


iex> mod = :lists 

‘lists 

iex> mod.flatten([i, [2],3]) 
[1,2,3] 


一 句 话 ， 我 们 只 是 简单 地 在 原子 :lists LAM T SH flatten ° 


13.5- Æ 


PATNA > RETURHRKE (nesting) 以 及 它 在 Elixir 中 是 如 何 工作 的 。 


考虑 下 面 的 例子 : 


defmodule Foo do 
defmodule Bar do 
end 

end 


该 例子 定义 了 两 个 模块 Foo 和 Foo.Bar。 后 者 在 Foo 中 可 以 用 Ba/ 为 名 来 访问 ， 因 为 它们 在 同一 
个 词法 作用 域 中 。 如 果 之 后 开发 者 决定 把 Bar 模 块 挪 到 另 一 个 文件 中 ， 那 它 就 需要 以 全 名 
(Foo.Bar) 或 者 别名 来 指 代 。 


换 名 话说， 上 面 的 代码 等 同 于 : 


defmodule Elixir.Foo do 
defmodule Elixir.Foo.Bar do 
end 
alias Elixir.Foo.Bar, as: Bar 
end 


13.6- 多 个 
到 Elixir v1.2， 可 以 一 次 使 用 alias,import,require 多 个 模块 。 这 在 建立 Elixir 程 序 的 时 候 很 常 
见 ， 特 别 是 使 用 吝 套 的 时 候 是 最 有 用 了 。 例 如 ， 假 设 你 的 程序 所 有 模块 都 谋 套 在 MyApp 下 ， 


需要 使 用 别名 MyApp.Foo , MyApp.Bar 和 MyApp.Baz ， 可 以 像 下 面 一 次 完成 : 


alias MyApp.{Foo, Bar, Baz} 


13.7- use 


use 用 于 请 求 在 当前 上 下 文中 允许 使 用 其 他 模块 ， 是 一 个 宏 不 是 指令 。 开 发 者 频繁 使 用 use Z 
在 当前 上 下 文 范围 内 引入 其 他 功能 ， 通 常 是 模块 。 


例如 ， 在 编写 测试 时 需要 使 用 ExUni 框 架 ， 开 发 者 需要 使 用 exunit.case 模块 : 


defmodule AssertionTest do 
use ExUnit.Case, async: true 


test "always pass" do 
assert true 
end 
end 


在 后 面 ， use 请 求 需要 的 模块 ， 然 后 调用 using /1 回调 函数 ， 多 许 模块 在 当前 上 下 文中 
注入 这 些 代码 。 总 体 说 ， 如 下 模块 : 


defmodule Example do 
use Feature, option: :value 
end 


会 编译 成 


defmodule Example do 

require Feature 

Feature. __using__(option: :value) 
end 


在 以 后 章节 我 们 可 以 看 到 ， 别 名 在 宏 机 制 中 扮演 了 很 重要 的 角色 ， 来 保证 宏 是 干净 的 
(hygienic) 。 


讨论 到 这 里 ， 模 块 基本 上 讲 得 差不多 了 。 之 后 会 讲解 模块 的 属性 。 


14- 模 块 属性 


作为 注释 
作为 常量 
作为 临时 存储 


在 Elixir 中 ， 模 块 属 性 (attributes) 主要 服务 于 三 个 目的 : 


1， 作 为 一 个 模块 的 注释 ， 通 常 附 加 上 用 户 或 虚拟 机 用 到 的 信息 
2. 作为 常量 
3. 在 编译 时 作为 一 个 临时 的 存储 机 制 


让 我 们 一 个 一 个 讲解 。 


14.1- 作 为 注释 
Elixir 从 Erlang 带 来 了 模块 属性 的 概念 。 例 子 : 


defmodule MyServer do 
@vsn 2 
end 


这 个 例子 中 ， 我 们 显 式 地 为 该 模块 设置 了 版 本 (vsn 即 Version) 属性 。 属性 标识 evsn 是 预定 
义 的 属性 名 称 ， 会 被 Erlang 虚 拟 机 的 代码 装载 机 制 使 用 : 读 取 并 检查 该 模块 是 否 在 某 处 被 更 
新 了 。 如 果 不 注 明 版 本 号 ， 会 被 自动 设置 为 这 个 模块 函数 的 md5 checksum 。 


Elixir 有 个 好 多 系统 保留 的 预定 义 属 性 。 比 如 一 些 常用 的 : 


© @moduledoc 为 整个 模块 提供 文档 说 明 
© @doc 为 该 属性 后 面 的 函数 或 宏 提供 文档 说 明 
。 @behaviour (注意 这 个 单词 是 英 式 拼 法 ) 用 来 注 明 一 个 OTP 或 用 户 自 定义 行为 
© @before compile 提供 一 个 每 当 模 块 被 编译 之 前 执行 的 钓 子 。 这 使 得 我 们 可 以 在 模块 被 
编译 之 前 往 里 面 注 入 函数 。 
@moduledoc 和 @doc 是 很 常用 的 属性 ， 推 荐 经 常 使 用 ( 写 文 档 ) 。 
Elixir 视 文档 为 一 等 公民 ， 提 供 了 很 多 方法 来 访问 文档 。 


让 我 们 回 到 上 几 章 定义 的 Math 模 块 ， 为 它 添加 文档 ， 然 后 依然 保存 在 math.ex 文 件 中 : 


defmodule Math do 
@moduledoc """ 
Provides math-related functions. 


## Examples 


iex> Math.sum(1, 2) 
3 


@doc nun 
Calculates the sum of two numbers. 


def sum(a, b), do: a + b 
end 


+ | 1% f heredocsi### ° heredocs# 377TH XA? AMENI F ER” REDON BAH 
格式 。 下 面 例 子 演 示 在 jex 中 ， 用 h 命 令 读 取 模 块 的 注释 : 

$ elixirc math.ex 

$ iex 

iex> h Math # Access the docs for the module Math 


iex> h Math.sum # Access the docs for the sum function 


Elixir 还 提供 了 ExDoc 工 具 ， 利 用 注释 生成 HTML 页 文档 。 
你 可 以 看 看 模块 里 面 列 出 的 模块 属性 列表 ， 看 看 Elixir 还 支持 那些 模块 属性 。 
Elixir 还 是 用 这 些 属性 来 定义 typespecs : 


。 @spec 为 一 个 函数 提供 specification 

e @callback 为 行为 回调 函数 提供 spec 

。 @type 定义 一 个 @spec 中 用 到 的 类 型 

。 @typep 定义 一 个 私有 类 型 ， 用 于 @spec 

。 @opaque 定义 一 个 opaque 类 型 用 于 @spec 


本 节 讲 了 一 些 内 置 的 属性 。 当 然 ， 属 性 可 以 被 开发 者 、 被 一 些 类 库 扩 展 用 来 支持 自 定 义 的 行 
为 o 


14.2- 作 为 常量 


Elixir 开 发 者 经 常会 将 模块 属性 当 作 常量 定义 使 用 : 


defmodule MyServer do 
@initial_state %{host: "147.0.0.1", port: 3456} 
I0.inspect @initial_state 

end 


不 同 于 Erlang， 默 认 情 况 下 用 户 定义 的 属性 不 会 被 存储 在 模块 里 。 属 性 值 仅 在 编译 时 存 
在 。 开发 者 可 以 通过 调用 Module.register_attribute/3 来 使 属性 的 行为 更 接近 Erlang。 


访问 一 个 未 定义 的 属性 会 报警 告 : 


defmodule MyServer do 
@unknown 
end 
warning: undefined module attribute @unknown, please remove access to @unknown or explici 


ED 汪汪 | 
最 后 ， 属 性 也 可 以 在 函数 中 被 读 取 : 





defmodule MyServer do 


@my_data 14 

def first_data, do: @my_data 

@my_data 13 

def second_data, do: @my_data 
end 


MyServer.first_data #=> 14 
MyServer.second_data #=> 13 


注意 ， 在 函数 内 读 取 某 属性 ， 读 取 的 是 该 属性 当前 值 的 快照 。 换 多 话说， 读 取 的 是 编译 时 的 
值 ， 而 非 运 行 时 。 后 面 我 们 将 看 到 ， 这 个 特点 使 得 属性 可 以 作为 模块 在 编译 时 的 临时 存储 。 


14.3- 作 为 临时 存储 
Elixir 组 织 中 有 一 个 项 目 ， 叫 做 Plug。 这 个 项 目的 目标 是 创建 一 个 通用 的 Web 库 和 框架 。 
类 似 于 ruby 的 rack 


Plug 库 允许 开发 者 定义 它们 自己 的 plug， 可 以 在 一 个 web 服务 器 上 运行 : 


defmodule MyPlug do 
use Plug.Builder 


plug :set_header 
plug :send_ok 


def set_header(conn, _opts) do 
put_resp_header(conn, "x-header", "set" ) 
end 


def send_ok(conn, _opts) do 
send(conn, 200, "ok") 
end 
end 


IO0.puts "Running MyPlug with Cowboy on http://localhost: 4000" 
Plug.Adapters.Cowboy.http MyPlug, [] 


上 面 例子 我 们 用 了 plug/1 宏 来 连接 各 个 在 处 理 请 求 时 会 被 调用 的 函数 。 在 内 部 ， 每 当 你 调 
用 plug/1 时 ，Plug 把 参数 存储 在 @plug 属 性 里 。 在 模块 被 编译 之 前 ，Plug 执 行 一 个 回调 函 
数 ， 这 个 函数 定义 了 处 理 http 请 求 的 方法 。 这 个 方法 将 顺序 执行 所 有 保存 在 @plug 属 性 里 的 
plugs ° 


为 了 理解 底层 的 代码 ， 我 们 需要 宏 。 因 此 我 们 将 回顾 一 下 元 编程 手册 里 这 种 模式 。 但 是 这 里 
的 重点 是 怎样 使 用 属性 来 存储 数据 ， 让 开发 者 得 以 创建 DSL (领域 特定 语言 ) 。 


另 一 个 例子 来 自 ExUnit 框 架 ， 它 使 用 模块 属性 作为 注释 和 存储 : 
defmodule MyTest do 
use ExUnit.Case 


@tag :external 
test "contacts external service" do 


end 
end 


ExUnit 中 ，@tag 标 签 被 用 来 注释 该 测试 用 例 。 之 后 ， 这 些 标签 可 以 作为 过 滤 测 试用 例 之 用 。 
例如 ， 你 可 以 避免 执行 那些 被 标记 成 :external 的 测试 ， 因 为 它们 执行 起 来 很 慢 。 


本 章 带 你 一 窥 Elixir 元 编程 的 冰山 一 角 ， 讲 解 了 模块 属性 在 开发 中 是 如 何 扮演 关键 角色 的 。 
下 一 章 将 讲解 结构 体 和 协议 。 
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在 之 前 的 几 章 中 ， 我 们 谈 到 过 图 : 


iex> map = %{a: 1, b: 2} 
%{a: 1, b: 2} 

iex> map[:a] 

1 

iex> %{map | a: 3} 

Walch, <i, log 2 


结构 体 是 基于 图 的 一 个 扩展 。 它 引入 了 默认 值 、 编 译 期 验证 和 多 态 性 。 


定义 一 个 结构 体 ， 你 只 需 在 模块 中 调用 defstruct/1 


iex> defmodule User do 
coe defstruct name: "john", age: 27 
<:> end 


现在 可 以 用 xuser() 语法 创建 这 个 结构 体 的 “实例 ”了 : 


iex> %User{} 

%User{ name: "john", age: 27 } 
iex> %User{ name: "meg" } 
%User{ name: "meg", age: 27 } 
iex> is_map(%User{}) 

Erue 


结构 体 的 编译 期 验证 ， 指 的 是 代码 在 编译 时 会 检查 结构 体 的 字段 存 不 存在 : 


iex> %User{ oops: :field } 
** (CompileError) iex:3: unknown key :oops for struct User 


当 讨 论 图 的 时 候 ， 我 们 演示 了 如 何 访问 和 修改 图 现 有 的 字段 。 结 构 体 也 是 一 样 的 : 


iex> john = %User{} 

%User{ name: "john", age: 27 } 
iex> john.name 

“johns 

iex> meg = %{ john | name: "meg" } 
%User{ name: "meg", age: 27 } 

iex> %{ meg | oops: :field } 

** (ArgumentError) argument error 


使 用 这 种 修改 的 语法 ， 庶 拟 机 可 以 知道 没有 新 的 键 增加 到 图 /结构 体 中 ， 使 得 图 可 以 在 内 存 中 
共享 它们 的 结构 。 在 上 面 例子 中 ，john 和 meg 共 享 了 相同 的 键 结构 。 


结构 体 也 能 用 在 模式 匹配 中 ， 它 们 保证 结构 体 有 相同 的 类 型 : 


iex> %User{name: name} = john 

%User{name: "john", age: 27} 

iex> name 

"John" 

iex> %User{} = %{} 

** (MatchError) no match of right hand side value: %{} 


这 里 可 以 用 模式 匹配 ， 是 因为 在 结构 体 底层 的 图 中 有 个 叫 struct WFR: 


iex> john. struct _ 
User 


简单 说 ， 结 构 体 就 是 个 光秃秃 的 图 外 加 一 个 默认 字段 。 但 是 ， 为 图 实现 的 协议 都 不 能 用 于 结 
构 体 。 例 如 ， 你 不 能 枚 举 也 不 能 用 [访问 一 个 结构 体 : 

iex> user = %User{} 

%User{name: "john", age: 27} 


iex> user[:name] 
** (Protocol.UndefinedError) protocol Access not implemented for %User{age: 27, name: "jo 
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结构 体 也 不 是 字典 
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字典 模块 的 函数 : 


iex> Dict.get(%User{}, :name) 
** (ArgumentError) unsupported dict: %User{name: "john", age: 27} 


下 一 章 我 们 将 介绍 结构 体 是 如 何 同 协议 进行 交互 的 。 


16- 协 议 


协议 和 结构 体 
回归 一 般 化 
内 建 协议 
协议 是 实现 Elixir 多 态 性 的 重要 机 制 。 任 何 数据 类 型 只 要 实现 了 某 协 议 ， 那 么 该 协议 的 分 发 就 
是 可 用 的 。 让 我 们 看 个 例子 
这 里 的 “协议 ”二 字 对 于 熟悉 ruby 等 具有 duck-typing 特 性 的 语言 的 人 来 说 会 比较 容易 理解 。 


在 Elixir 中 ， 只 有 false 和 nil 被 认为 是 false 的 。 其 它 的 值 都 被 认为 是 true。 根据 程序 需要 ， 有 时 
需要 一 个 blank? 协议 (注意 ， 我们 此 处 称 之 为 “协议 ") ， 返 回 一 个 布尔 值 ， 以 说 明 该 参数 是 


否 为 空 。 举 例 来 说 ， 一 个 空 列表 或 者 空 二 进 制 可 以 被 认为 是 空 的 。 
我 们 可 以 如 下 定义 协议 : 


defprotocol Blank do 
@doc "Returns true if data is considered blank/empty" 
def blank?(data) 

end 


从 上 面 代码 的 语法 上 看 ， 这 个 协议 Blank 声明 了 一 个 函数 blank? ， 接 受 一 个 参数 。 看 起 来 
这 个 "协议 " 像 是 一 份 声明 ， 需 要 后 续 的 实现 。 下 面 我 们 为 不 同 的 数据 类 型 实现 这 个 协议 : 


H MKATA E 

defimpl Blank, for: Integer do 
def blank?(_), do: false 

end 


# 只 有 空 列表 是 “ 空 ”的 
defimpl Blank, for: List do 
def blank?([]), do: true 

def blank?(_), do: false 
end 


# 只 有 空 nap 是 “ 空 “ 
defimpl Bene for: Map do 
# 一 定 要 记 住 ， 我 们 不 能 匹配 %{} ， 因 为 它 能 match 所 有 的 map - 
# 但 是 我 们 能 检查 它 的 Size 是 不 是 9 
# 检查 Size2 是 很 快速 的 操作 
def blank?(map), do: map_size(map) == 0 
end 


# 只 有 false 和 nil 这 两 个 原子 被 认为 是 空 得 
deena Blank, for: Atom do 

def blank?(false), do: true 

def blank?(nil), do: true 

def blank?(_), do: false 
end 


我 们 可 以 为 所 有 内 建 数 据 类 型 实现 协议 : 


。 原子 

e BitString 
e 浮 点 型 
© 函数 


。 列表 


现在 手边 有 了 一 个 定义 并 被 实现 的 协议 ， 如 此 使 用 之 : 


iex> Blank.blank?(0) 

false 

iex> Blank.blank?([]) 

true 

iex> Blank.blank?([1, 2, 3]) 
false 


给 它 传递 一 个 并 没有 实现 该 协议 的 数据 类 型 ， 会 导致 报错 : 


iex> Blank.blank?("hello") 
** (Protocol.UndefinedError) protocol Blank not implemented for "hello" 


16.1- 协 议和 结构 体 


协议 和 结构 体 一 起 使 用 能 够 加 强 Elixir 的 可 扩展 性 。 


在 前 面 几 章 中 我 们 知道 ， 尽 管 结构 体 本 质 上 就 是 图 (map) ， 但 是 它们 和 图 并 不 共享 各 自 协 


议 的 实现 。 像 前 几 章 一 样 ， 我 们 先 定 义 一 个 名 为 user 的 结构 体 : 


iex> defmodule User do 
gave defstruct name: "john", age: 27 
> end 
{ module User, <<70, 79, 82 0 >> s Strhuct. =, OF 


然后 看 看 能 不 能 用 刚才 定义 的 协议 : 
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iex> Blank.blank?(%{}) 
true 
iex> Blank.blank?(%User{}) 


** (Protocol.UndefinedError) protocol Blank not implemented for %User{age: 27, name: 


a -n 








"joh 
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果然 ， 结 构 体 没有 使 用 协议 针对 图 的 实现 。 因此 ， 结 构 体 需要 使 用 它 自己 的 协议 实现 : 


defimpl Blank, for: User do 
def blank?(_), do: false 
end 


如 果 愿 意 ， 你 可 以 定义 你 自己 的 语法 来 检查 一 个 user 有 是否 为 室 。 不 光 如 此 ， 你 还 可 以 使 用 结 
构 体 创建 更 强健 的 数据 类 型 (比如 队列 ) ， 然 后 实现 所 有 相关 的 协议 (就 像 枚 
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举 Enumerable 那样 ) ， 检 查 是 否 为 空 等 等 。 


有 些 时 候 ， 程 序 员 们 希望 给 结构 体 提 供 某 些 默认 的 协议 实现 ， 因 为 显 式 给 所 有 结构 体 都 实现 
某 些 协议 实在 是 太 枯燥 了 。 这 引出 了 下 一 节 “ 回 归 一 般 化 ”(falling back to any) 的 说 法 。 


16.2- 回 归 一 般 化 


能 够 给 所 有 类 型 提供 默认 的 协议 实现 肯定 是 很 方便 的 。 在 定义 协议 时 ， 
把 @fallback_to_any 设置 为 true 即 可 : 


defprotocol Blank do 
@fallback_to_any true 
def blank?(data) 

end 


现在 这 个 协议 可 以 被 这 么 实现 : 


defimpl Blank, for: Any do 
def blank?(_), do: false 
end 


现在 ， 那 些 我 们 还 没有 实现 plank 协议 的 数据 类 型 (包括 结构 体 ) 也 可 以 来 判断 是 否 为 空 了 
(虽然 默认 会 被 认为 是 false， 哈 哈 ) 。 


16.3- 内 建 协议 


Elixir 自 带 了 一 些 内 建 的 协议 。 在 前 面 几 章 中 我 们 讨论 过 枚 举 模块 ， 它 提供 了 许多 方法 。 只 要 
任何 一 种 数据 结构 它 实 现 了 Enumerable 协 议 ， 就 能 使 用 这 些 方法 : 


iex> Enum.map [1, 2, 3], fn(x) -> x * 2 end 

[2,4,6] 

iex> Enum.reduce 1..3, 0, fn(x, acc) -> x + acc end 
6 


= 


另 一 个 例子 是 String.Chars 协议 ， 它 规定 了 如 何 将 包含 字符 的 数据 结构 转换 为 字符 串 类 型 。 
CREA 函数 to_string 


iex> to_string :hello 
-hello 


注意 ， 在 Elixir 中 ， 字 符 串 插值 操作 里 面 调用 了 to_string BH: 


iex> "age: #{25}" 
kager 25) 


上 面 代码 能 工作 ， 是 因为 25 是 数字 类 型 ， 而 数字 类 型 实现 了 string.chars 协议 。 如 果 传 进去 
的 是 元 组 就 会 报错 : 


iex> tuple = {1, 2, 3} 

ily 27 3} 

iex> "tuple: #{tuple}" 

** (Protocol.UndefinedError) protocol String.Chars not implemented for {1, 2, 3} 


当 想 要 打印 一 个 比较 复杂 的 数据 结构 时 ， 可 以 使 用 inspect 函数 。 该 函数 基于 协 


ÙL Inspect 


iex> "tuple: #{inspect tuple}" 
Macon Spal, ap ehh 


Inspect 协议 用 来 将 任意 数据 类 型 转换 为 可 读 的 文字 表述 。1IEX 用 来 打印 表达 式 结果 用 的 就 是 


> 。 


bw. 


iex> {1, 2, 3} 

{1,2,3} 

iex> %User{} 

%User{name: "john", age: 27} 


inspect 是 ruby 中 非常 常用 的 方法 。 这 也 能 看 出 Elixir 的 作者 们 真是 绞 尽 脑汁 把 Elixir 的 语 
法 尽量 往 ruby 上 人 靠 。 


记 住 ， 头顶 着 # 号 被 插 的 值 z 会 被 to_string 表现 成 纯 字 符 串 o 在 转换 为 可 读 的 字符 串 时 丢失 
了 信息 ， 因 此 别 指望 还 能 从 该 字符 串 取 回 原来 的 那个 对 象 : 


iex> inspect &(&1+2) 
"#Function<6.71889879/1 in :erl_eval.expr/5>" 


Elixir 中 还 有 些 其 它 协议 ， 但 本 章 就 讲 这 几 个 比较 常用 的 。 下 一 章 将 讲 讲 Elixir 中 的 错误 捕捉 以 
及 异常 。 


17- 异 常 处 理 


Errors 

Throws 

Exits 

After 

变量 作用 域 

Elixir 有 三 种 错误 处 理 机 制 : errors，throws 和 exits。 本 章 我 们 将 逐个 讲解 它们 ， 包 括 应 该 在 何 


时 使 用 哪 一 个 。 


17.1-Errors 
举 个 例子 ， 党 试 让 原子 加 上 一 个 数字 ， 就 会 激发 一 个 错误 (errors) 


iex> :foo + 1 
** (ArithmeticError) bad argument in arithmetic expression 
:erlang.+(:foo, 1) 


使 用 宏 raise/1 可 以 在 任何 时 候 激发 一 个 运行 时 错误 : 


iex> raise "oops" 
** (RuntimeError) oops 


用 raise/2 ， 并 且 附 上 错误 名 称 和 一 个 键 值 列表 可 以 激发 规定 好 的 错误 : 


iex> raise ArgumentError, message: "invalid argument foo" 
** (ArgumentError) invalid argument foo 


你 可 以 使 用 defexception/2 定义 你 自己 的 错误 。 最 常见 的 是 定义 一 个 有 消息 说 明 的 错误 : 


iex> defexception MyError, message: "default message" 
iex> raise MyError 

** (MyError) default message 

iex> raise MyError, message: "custom message" 

** (MyError) custom message 


用 try/catch 结构 可 以 处 理 异 常 : 


iex> try do 
ee raise "oops" 
..> rescue 
a be e in RuntimeError -> e 
..> end 
RuntimeError[message: "oops"] 


这 个 例子 处 理 了 一 个 运行 时 异常 ， 返 回 该 错误 本 身 (会 被 显示 在 IEx 对 话 中 ) 。 在 实际 操作 
中 ，Elixir 程 序 员 很 少 使 用 try/rescue 结构 。 例如 ， 当 文件 打开 失败 ， 很 多 编程 语言 会 强制 你 
去 处 理 一 个 异常 。 而 Elixir 提 供 的 File.read/1 函数 返回 包含 信息 的 元 组 ， 不 管 文 件 打 开 成 功 
与 否 : 


iex> File.read "hello" 

{:error, :enoent} 

iex> File.write "hello", "world" 
:OK 

iex> File.read "hello" 

{:ok, "world"} 


这 个 例子 中 没有 try/rescue 。 如 果 你 想 处 理 打 开 文 件 可 能 的 不 同 结果 ， 你 可 以 使 用 case 来 匹 
配 : 


iex> case File.read "hello" do 

ae {:ok, body} -> I0.puts "got ok" 

ane {:error, body} -> I0.puts "got error" 
..> end 


使 用 这 个 匹配 处 理 ， 你 可 以 自己 决定 要 不 要 把 问题 抛 出 来 。 这 就 是 为 什么 Elixir 不 

让 File.read/1 等 函数 自己 抛 出 异常 。 它 把 决定 权 留 给 程序 员 ， 让 他 们 寻找 最 合适 的 处 理 方 
法 。 

ho RAR UL SEG 〈 打 开 文 件 时 文件 不 存在 这 确实 是 一 个 错误 ) ， 你 可 以 简单 地 使 


用 File.read!/1 


iex> File.read! "unknown" 
** (File.Error) could not read file unknown: no such file or directory 
(elixir) lib/file.ex:305: File.read!/1 


th 4) TE Tt? ee try/rescue 是 因为 我 们 不 用 错误 处 理 来 控制 程序 执行 流程 。 在 Elixir 
中 ， 我 们 视 错 误 为 其 字面 意思 : 它们 只 不 过 是 用 来 表示 意外 或 异常 的 信息 。 
to RAR AY) ar nee 过 程 ， 你 可 以 使 用 throws ° 


17.2-Throws 


在 Elixir 中 ， 你 可 以 抛 出 (throw) 一 个 值 稍 后 处 理 。 throw 和 catch 就 被 保留 着 为 了 处 理 一 些 
你 抛 出 了 值 ， 但 是 不 用 try/catch 就 取 不 到 的 情况 。 


情况 实际 中 很 少 出 现 ， 除 非 当 一 个 库 的 接口 没有 提供 合适 的 API 等 情况 。 例如 ， 假 如 枚 举 


这 些 
模块 没有 提供 任何 AP| 来 寻找 某 范围 内 第 一 个 13 的 倍数 : 


iex> try do 
Enum.each -50..50, fn(x) -> 
if rem(x, 13) == 0, do: throw(x) 
end 
"Got nothing" 
catch 
x -> "Got #{x}" 
end 
-39" 
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{2 CRIA T RAŽ HA Enum. find/2 


iex> Enum.find -50..50, &(rem(&1, 13) == 0) 
-39 


17.3-Exits 


每 段 Elixir 代 码 都 在 进程 中 运行 ， 进 程 与 进程 相互 交流 。 当 一 个 进程 终止 了 ， 它 会 发 出 exit 信 
号 。 一 个 进程 可 以 通过 显 式 地 发 出 这 个 信号 来 终止 : 


iex> spawn_link fn -> exit(1) end 
#PID<0.56.0> 
** (EXIT from #PID<0.56.0>) 1 


上 面 的 例子 中 ， 链 接着 的 进程 通过 exit 信号 ( 带 有 参数 数字 1) 而 终止 。Elixir shell 自 动 
处 理 这 个 信息 并 把 它们 显示 在 终端 


exit 还 可 以 被 try/catch 块 捕获 处 理 : 


iex> try do 
> exit "I am exiting" 
..> catch 
> :exit, _ -> "not really" 
...> end 
"not really" 


因为 try/catch 已 经 很 少 用 了 ， 用 它们 捕获 exit 信 号 就 更 少见 了 。 


exit 信 号 是 Erlang 虚 拟 机 提供 的 高 容错 性 的 重要 部 分 。 进 程 通常 都 在 监督 树 (supervision 
trees) 下 运行 。 监督 树 本 身 也 是 进程 ， 它 们 通过 exit 信 号 监督 其 它 进程 。 然 后 通过 某 些 策略 
决定 是 否 重启 。 


就 是 这 种 监督 系统 使 得 try/catch 和 try/rescue 代码 块 很 少 用 到 。 与 其 处 理 一 个 错误 ， 不 如 
让 它 快速 失败 。 因为 在 失败 后 ， 监 督 树 会 保证 我 们 的 程序 将 恢复 到 一 个 已 知 的 初始 状态 去 。 


17.4-After 


有 时 候 有 必要 使 用 try/after 来 保证 某 资 源 在 使 用 后 被 正确 关闭 或 清除 。 例 如， 我 们 打开 一 
个 文件 ， 然 后 使 用 try/after 来 确保 它 在 使 用 后 被 关闭 : 


iex> {:ok, file} = File.open "sample", [:utf8, :write] 
iex> try do 
I0.write file, "ola" 
raise "oops, something went wrong" 
after 
File.close(file) 
or end 
** (RuntimeError) oops, something went wrong 


VVVVV 


17.5- 变 量 作用 域 


对 于 定义 在 try/catch/rescue/after 代码 块 中 的 变量 ， 切 记 不 可 让 它们 泄露 到 外 面 去 。 这 时 因 
A try 代码 块 有 可 能 会 失败 ， 而 这 些 变 量 此 时 并 没有 正常 绑 定 数值 : 


iex> try do 
pee from_try = true 
...> after 
TE from_after = true 
...> end 
iex> from_try 
** (RuntimeError) undefined function: from_try/0 
iex> from_after 
** (RuntimeError) undefined function: from_after/0 


至 此 我 们 结束 了 对 try/catch/rescue 等 知识 的 介绍 。 你 会 发 现 其 实 这 些 概念 在 实际 的 Elixir 纺 
程 中 不 太 常 用 。 尽 管 的 确 有 时 也 会 用 到 。 


是 时 候 讨 论 一 些 Elixir 的 概念 ， 如 列表 速 构 (comprehensions) 和 魔法 印 (sigils) 了 。 


18- 列 表 速 构 (Comprehension) 


生成 器 和 过 滤 器 
比特 串 生 成 器 


Into 


Comprehensions 翻 译 成 “ 速 构 " 不 知道 贴 不 贴切 ， 这 参照 了 《Erlang/OTP in Action) i#4 

AÈ o “ 速 构 "是 函数 式 语 言 中 常见 的 概念 ， 它 大 体 上 指 的 是 用 一 套 规 则 (比如 从 另 一 

个 列表 ， 过 滤 掉 一 些 元 素 ) es 

这 个 概念 我 们 在 中 学 的 数学 课 上 就 可 能 已 经 接触 过 ， 在 大 学 

W [x | xE€Nn} Wr BRA ; 
素 映 射 生成 过 来 的 。 相 关 知 识 可 见 WIKI。 


ik 

Ae 
; ok 
> + 


Elixir 中 ， 使 用 枚 举 类 型 (如 列表 ) 来 做 循环 操作 是 很 常见 的 。 对 对 象 列表 进行 枚 举 时 ， 通 常 
要 有 选择 性 地 过 滤 掉 其 —— > EATER 变换 。 列 表 速 构 (comprehensions) 就 
是 为 此 目的 诞生 的 语法 糖 : 把 这 见 任务 分 组 ， 放 到 特殊 的 for 中 执行 。 


例如 ， 我 们 可 以 这 样 计算 列表 中 每 个 元 素 的 平方 : 


iex> for n <- [1, 2, 3, 4], do: n* n 
[1, 4, 9, 16] 


注意 看 ，<- 符号 就 是 模拟 自 e 的 形象 这 个 例子 用 熟悉 (FAK oR ARREA AHA 
就 另 当 别 论 ) 的 数学 符号 表示 就 是 : 


S = { X^2 | X € [1,4], X EN} 


这 个 例子 用 常见 的 编程 语言 去 理解 ， 基 本 上 类 似 于 foreach...in... 什 么 的 。 但 是 更 强大 。 
一 个 列表 速 构 由 三 部 分 组 成 : 生成 器 ， 过 滤器 和 收集 器 


18.2- 生 成 器 3 和 过 Us 3 


在 上 面 的 例子 中 ，n <- [1, 2, 3, 4] 就 是 生成 器 。 它 字面 意思 上 生成 了 即将 要 在 速 构 中 使 用 
的 数值 。 任 何 枚 举 类 型 都 可 以 传递 给 生成 器 表达 式 的 右 端 : 


iex> for n <- 1..4, do: n* n 
[1, 4, 9, 16] 


这 个 例子 中 的 生成 器 是 一 个 范围 。 


生成 器 表达 式 支持 模式 匹配 ， 它 会 忽略 所 有 不 匹配 的 模式 。 想象 一 下 如 果 不 用 范围 而 是 用 一 
个 键 值 列表 ， 键 只 有 :good 和 :bad 两 种 ， 来 计算 中 间 被 标记 成 'good ' 的 元 素 的 平方 : 


iex> values = [good: 1, good: 2, bad: 3, good: 4] 
iex> for {:good, n} <- values, do: n* n 
[1, 4, 16] 


过 滤器 能 过 滤 掉 某 些 产生 的 值 。 例 如 我 们 可 以 只 对 奇数 进行 平方 运算 : 


iex> require Integer 
iex> for n <- 1..4, Integer.odd?(n), do: n* n 


[1, 9] 


过 滤器 会 保留 所 有 判断 结果 是 非 nil 或 非 false 的 值 。 


a 


的 来 说 ， 速 构 比 直接 使 用 枚 举 或 流 模块 的 函数 提供 了 更 精确 的 表述 。 不 但 如 此 ， 速 构 还 接 


BEARS 和 过 滤器 。 下 面 就 是 一 个 例子 ， 代 码 接受 目录 列表 ， 删 除 这 些 目录 下 的 所 有 文 
件 : 


for dir <- dirs, 
file <- File.ls!(dir), 
path = Path.join(dir, file), 
File.regular?(path) do 
File.rm! (path) 
end 


需要 记 住 的 是 ， 在 速 构 中 ， 变 量 赋值 这 种 事 应 在 生成 器 中 进行 。 因 为 在 过 滤器 或 代码 块 中 的 


赋值 操作 不 会 反映 到 速 构 ron o 


18.2- 比 特 串 生成 器 


速 构 也 支持 比特 串 作 为 生成 器 ， 而 且 这 种 生成 器 在 组 织 处 理 比特 串 的 流 时 非常 有 用 。 下面 的 
例子 中 ， 程 序 从 二 进 制 数据 〈 表 示 为 << 像 素 1 的 R 值 ， 像 素 1 的 G 值 ， 像 素 1 的 B 值 ， 像 素 2 的 R 


值 ， 像素 2 的 G...>>) 中 接收 一 个 像素 的 列表 ， 把 它们 转换 为 元 组 : 


iex> pixels = <<213, 45, 132, 64, 76, 32, 76, ©, ©, 234, 32, 15>> 
iex> for <<r::8, g::8, b::8 <- pixels>>, do: {r, g, b} 
[{213, 45,132}, {64, 76, 32}, {76, 0, 0}, {234, 32, 15}] 


比特 串 生 成 器 可 以 和 "普通 的 " 改 举 类 型 生成 器 混合 使 用 ， 过 滤器 也 是 。 


18.3-Into 


在 上 面 的 例子 中 ， 速 构 返 回 一 个 列表 作为 结果 。 但是， 通过 使 用 into 选项 ， 速 构 的 结果 可 
以 插入 到 一 个 不 同 的 数据 结构 中 。 例如， 你 可 以 使 用 比特 串 生成 器 加 上 into 来 轻松 地 构成 
无 空格 字符 串 : 


iex> for <<c <- " hello world ">>, c != ?\s, into: "", do: <<c>> 
"helloworld" 


集合 、 图 以 及 其 他 字典 类 型 都 可 以 传递 给 :into 选项 。 总 的 来 说 ， :into 接受 任何 实现 了 
Collectable 协 议 的 数据 结构 。 


例如 ，1O 模 块 提供 了 流 。 流 既是 Enumerable 也 是 Collectable。 你 可 以 使 用 速 构 实 现 一 个 回声 
终端 ， 让 其 返回 任何 输入 的 东西 的 大 写 形式 : 


iex> stream = 10.stream(:stdio, :line) 

iex> for line <- stream, into: stream do 
..>  String.upcase(line) <> "\n" 

...> end 


现在 在 终端 中 输入 任意 字符 事 ， 你 会 看 到 同样 的 内 容 以 大 写 形式 被 打印 出 来 。 不幸 的 是 ， 这 
个 例子 会 让 你 的 shell 陷 入 到 该 速 构 代码 中 ， 只 能 用 Ctrl+C 两 次 来 退出 。 


19- 魔 法 印 (Sigils) 


正则 表达 式 
字符 串 、 字 符 列 表 和 单词 魔法 印 
自 定 义 魔法 印 


看 看 标题 ， 这 个 "魔法 印 "是 什么 奇 范 翻译 ? Sigil 原 意 是 " 魔 符 ， 图 章 ， 印 记 ”， 如 古代 西方 
魔幻 传说 中 的 巫女 、 魔 法 师 画 的 封印 或 者 召唤 魔鬼 的 六 芒 星 ， 中 国道 士 画 的 噬 符 ， 火 影 
里 面 召唤 守护 普 的 血 印 等 。 

在 计算 机 编程 领域 ，Sigil 指 的 是 在 变量 名 称 上 做 的 标记 ， 用 来 标明 它 的 作用 域 或 者 类 型 
什么 的 。 例 如 某 语言 里 面 $var 中 的 $ 就 是 这 样 的 东西 ， 表 示 其 为 全 局 变量 。 

这 么 看 ， 翻 译 成 "魔法 印 " 还 挺 带 感 呢 。 


我 们 已 经 学 习 了 Elixir 提 供 ee id ER) F SiMe he a 
Elixir 中 所 有 的 文本 描述 型 数据 类 型 来 说 ， 这 些 只 是 冰山 一 角 。 其 它 的 ， 例 如 原子 也 是 一 种 文 
本 描述 型 数据 类 型 。 


Elixir 的 一 个 特点 就 是 高 可 扩展 性 : 开发 者 能 够 为 特定 的 领域 来 扩展 语言 。 计 算 机 科学 的 领域 
已 是 如 此 广阔 。 几 乎 无 法 设计 一 门 语言 来 涵盖 所 有 范围 。 我 们 的 打算 是 ， 与 其 创造 出 一 种 万 
能 的 语言 ， 不 如 创造 一 种 可 扩展 的 语言 ， 让 开发 者 可 以 根据 所 从 事 的 领域 来 对 语言 进行 扩 
展 。 


本 章 将 讲述 “魔法 印 (sigils) ”， 它 是 Elixir 提 供 的 处 理 文本 描述 型 数据 的 一 种 机 制 。 
19.1- 正 则 表达 式 


魔法 印 以 波浪 号 (~) 起 头 ， 后 面 跟着 一 个 字母 ， 然 后 是 分 隔 符 。 最 常用 的 魔法 印 是 ~r， 代 表 
正则 表达 式 : 


# A regular expression that returns true if the text has foo or bar 


iex> regex = ~r/foo|bar/ 
~r/foo|bar/ 

iex> "foo" =~ regex 

true 

iex> "bat" =~ regex 
false 


Elixir 提 供 了 Perl 兼 容 的 正则 表达 式 (regex) ， 由 PCRE 库 实现 。 


正则 表达 式 支持 修饰 符 (modifiers) ， 例 如 i 修饰 符 使 该 正则 表达 式 无 视 大 小 写 : 


iex> "HELLO" =~ ~r/hello/ 
false 
iex> "HELLO" =~ ~r/hello/i 
true 


阅读 Regex 模 块 获取 关于 其 它 修饰 符 的 及 其 所 支持 的 操作 的 更 多 信息 
目前 为 止 ， 所 有 的 例子 都 用 了 / 界定 正则 表达 式 。 事 实 上 魔法 印 支持 8 种 不 同 的 分 隔 符 : 


~r/hello/ 
~r|hello| 
~r"hello" 
~r'hello' 
~r(hello) 
~r [hello] 
~r {hello} 
~r<hello> 
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式 的 分 隔 符 会 让 人 困惑 ， 分 不 清 括 号 是 正则 模式 的 一 部 分 还 是 别 的 什么 。 但 是 ， 括 号 对 某 些 
魔法 印 来 说 就 很 方便 。 


19.2- 字 符 串 、 字 符 列表 和 单词 魔法 印 
除了 正则 表达 式 ，Elixir 还 提供 了 三 种 魔法 印 。 
-s 魔法 印 用 来 生成 字符 串 ， 类 似 双 引 号 的 作用 : 


iex> ~s(this is a string with "quotes") 
Stns Lo a Stringi witheN quotesNn sy 


通过 这 个 例子 可 以 看 出 ， 如 果 文 本 中 有 双 引 号 ， 又 不 想 逐 个 转 义 ， 可 以 用 这 种 魔法 印 来 包 训 
字符 串 。 
~c 魔法 印 用 来 生成 字符 列表 : 


iex> ~c(this is a string with "quotes") 
"this is a string with "quotes"' 


~w 魔法 印 用 来 生成 单词 ， 以 空格 分 隔 开 : 


iex> ~w(foo bar bat) 
[etool, ban "bat"] 


w 魔法 印 还 接受 c > s 和 a 修饰 符 〈 分 别 代表 字符 列表 ， 字 符 串 和 原子 ) 来 选择 结果 的 


类 型 : 


iex> ~w(foo bar bat)a 
[:foo, :bar, :bat] 


除了 小 写 的 魔法 印 ，Elixir 还 支持 大 写 的 魔法 印 。 如 ，-s 和 -s 都 返回 字 


义 字 符 而 后 者 不 会 : 


iex> ~s(String with escape codes \x26 interpolation) 

"String with escape codes & interpolation" 

iex> ~S(String without escape codes and without #{interpolation}) 
"String without escape codes and without \#{interpolation}" 


字符 串 和 字符 列表 支持 以 下 转 义 字符 : 


魔法 印 还 支持 多 行文 本 (heredocs) ， 使 用 的 是 三 个 双 引 号 或 单 引 号 : 


\" 表示 一 个 双 引 号 

\ 表示 一 个 单 引 号 

\ RRA RA 

\a 响 铃 

\b 退 格 

\d 删除 

\e 退出 

\f 换 页 

\n 新 行 

\r 换行 

\s 空格 

\t 水 平 制 表 符 

WV 垂直 制 表 符 

\DDD, \DD, \D 入 进 制 数 字 (如 \377 ) 
\xDD 十 六 进 制 数 字 (如 \X13 ) 
\x{D...} 多 个 十 六 进 制 字符 的 十 六 进 制 数 ( 如 \x{abc13} 


iex> ~s" nn 


ge mS S 
..> a heredoc string 


> "uu 


符 


@doc nun 
Converts double-quotes to single-quotes. 


## Examples 


Tex> CONVEGE( NV TOON.) 
" OO W 


def convert(...) 


使 用 ~s ， 我 们 就 可 以 避免 问题 : 
@doc ~S"" "n 
Converts double-quotes to single-quotes. 
## Examples 


iex> convert("\"foo\"") 
"n FOOL W 


def convenes...) 


19.3- 自 定义 魔法 印 


本 章 开 头 提 到 过 ， 魔 法 印 是 可 扩展 的 。 事 实 上 ， 魔 法 印 ~r/foo/i 等 于 是 用 两 个 参数 调用 了 函 
数 sigil_r 


iex> sigil_r(<<"foo">>, 'i') 
~r"foo"i 


就 是 说 ， 我 们 可 以 通过 该 函数 阅读 魔法 印 ~r 的 文档 : 


iex> h sigil_r 


我 们 也 可 以 通过 实现 相应 的 函数 来 提供 我 们 自己 的 魔法 印 。 例 如 ， 我 们 来 实现 一 个 -i(N) KH 
法 印 ， 返 回 整数 : 


iex> defmodule MySigils do 
> def sigil i(string, []), do: String.to_integer(string) 
..> end 

iex> import MySigils 

iex> ~1("13") 


魔法 印 通过 宏 ， 可 以 用 来 做 一 些 发 生 在 编译 时 的 工作 。 例 如 ， 正 则 表达 式 在 编译 时 会 被 编 
译 ， 而 在 执行 的 时 候 就 不 必 再 被 编译 了 。 如 果 你 对 此 主题 感 兴趣 ， 可 以 多 阅读 关于 宏 的 次 
料 ， 并 且 阅 读 Kernel 模 块 中 那些 魔法 印 的 实现 。 


20- 下 一 步 


构建 你 第 一 个 Elixir 工 程 
社区 和 其 它 资 源 


Erlang— *¥ 


还 想 学 习 更 多 ? 继续 阅读 吧 ! 


大 大 m . 
20.1- 构 建 你 第 一 个 Elixir 工 程 
Elixir 提 供 了 一 个 构建 工具 叫做 Mix。 你 可 以 简单 地 执行 以 下 命令 来 开始 你 的 项 目 : 


mix new path/to/new/project 


我 们 已 经 写 好 了 一 份 手册 ， 涵 盖 了 如 何 构建 一 个 Elixir 程 序 ， 包 括 它 自己 的 监督 树 ， 配 置 ， 测 
试 等 等 。 这 个 程序 是 一 个 分 布 式 的 键 值 对 存储 程序 : 


e Mix and OTP 
20.2- 社 区 和 其 它 资源 
Blog 
文档 
Seriously, please check out my next works 
about advanced Elixir programming ! 


请 看 据 作 《高 级 Elixir 编 程 》. 名 字 随 便 起 的 ， 主 要 是 Elixir 编 程 一 些 进 阶 的 知识 。 翻 译 、 整 理 自 
官网 或 者 自己 理解 等 。 https://github.com/straightdave/elixir_adv 


elixir 进 阶 (Mix 和 OTP 入 门 ) 


作者 : straightdave 
来 源 : advanced_elixir 


Elixir 是 基于 Erlang 庶 拟 机 的 语言 。 要 丨 正 发 挥 Elixir 高 可 用 、 高 并 发 等 等 优势 ， 需 要 了 解 和 学 
习 E 在 它 背 后 Erlang 世 界 的 知识 。 本 repo 的 文章 ， 也 属于 一 个 入 门 。 


e 1-Mix 简 介 

e 2-Agent 

e 3-GenServer 

e 4-GenEvent 

。 5- 监 督 者 和 应 用 程序 
e 6-ETS 

© 7- 依 赖 和 伞 工 程 

e 8- 任 务 和 gen tcp 

。 9- 文档， 测试 和 管道 
© 10- 分 布 式 任务 和 配置 


1-Mix 简 介 


在 这 份 指导 手册 中 ， 我 们 将 学 习 创 建 一 个 完整 的 Elixir 应 用 程序 ， 以 及 监督 树 、 配 置 、 测 试 等 
高 级 概念 。 
这 个 程序 是 一 个 分 布 式 的 键 - 值 存 储 数 据 库 。 我 们 会 把 键 - 值 存 储 在 “ 桶 "中 ， 分 布 存储 到 多 个 节 
点 。 我们 还 会 创建 一 个 简单 的 客户 端 工 具 ， 可 以 连接 任意 一 个 节点 ， 并 且 能 够 发 送 类 似 以 下 
的 命令 : 

CREATE Shopping 

OK 


PUT shopping milk 1 
OK 


PUT shopping eggs 3 
OK 


GET shopping milk 
1 
OK 


DELETE shopping eggs 
OK 


为 了 编写 这 个 程序 ， 我 们 将 主要 用 到 以 下 三 个 工具 : 


e OTP(Open Telecom Platform) OTP 是 一 个 随 Erlang 发 布 的 代码 库 集 合 。Erlang 开 发 者 
使 用 OTP 来 创建 健壮 的 、 高 度 容错 的 程序 。 在 本 章 中 ， 我 们 将 来 探索 与 Elixir 整 合 在 一 起 
的 OTP， 包 括 监 督 树 、 事 件 管 理 等 等 ; 


e Mix Mix 是 随 Elixir 发 布 的 构建 工具 ， 用 来 创建 、 编 译 、 测 试 你 的 应 用 程序 ， 还 可 以 用 来 管 
理 依赖 等 ; 
e ExUnit ExUnit 是 一 个 随 Elixir 发 布 的 单元 测试 工具 
本 章 会 用 Mix 来 创建 我 们 第 一 个 工程 ， 探 索 OTP、Mix 以 及 ExUnit 的 各 种 特性 。 


EE: 

本 手册 需要 Elixir vO.15.0 (1.2.0 发 布 后 ， 这 里 被 改 为 1.2.0 了 ) 或 以 上 。 你 可 以 使 用 命 
令 elixir -v 查看 版 本 。 如 果 需 要 ， 可 以 参考 《Elixir 入 门 手 册 》 第 一 章节 内 容 安装 最 新 
的 版 本 。 

如 果 发 现任 何 错误 ， 请 开 issue 或 者 发 pull request 。 


1.1- 第 一 个 应 用 程序 


当 你 安装 Elixir 时 ， 你 不 仅 得 到 了 elixir ， elixirc 和 iex 命令 ， 还 得 到 一 个 可 执行 的 Elixir 
脚本 叫做 mix 。 


从 命令 行 输入 mix new 命令 来 创建 我 们 的 第 一 个 工程 。 我 们 需要 传递 工程 名 称 作为 参数 (在 
这 里 ， 比 如 叫做 kv ) ， 然 后 告诉 mix 我 们 的 主 模块 的 名 字 是 全 大 写 的 kv 。 否则 按照 默 
认 ，mix 会 创建 一 个 主 模块 ， 名 字 是 第 一 个 字母 大 写 的 工程 名 称 ( kv ) 。 因为 K 和 V 的 含义 
在 我 们 的 程序 中 上 是 平等 关系 ， 所 以 最 好 是 都 用 大 写 : 


$ mix new kv --module KV 


Mix 将 创建 一 个 文件 夹 名 叫 kv ， 里 面 有 一 些 文件 : 


creating README.md 

creating .gitignore 

creating mix.exs 

creating config 

creating config/config.exs 
creating lib 

creating lib/kv.ex 

creating test 

creating test/test_helper.exs 
creating test/kv_test.exs 


ne ee a RE ee eR a OR a a 


现在 简单 看 看 这 些 创建 的 文件 。 
注意 : 
Mix 是 一 个 Elixir 可 执行 脚本 。 这 意味 着 ， 你 要 想 用 mix 为 名 直接 调用 它 ， 需要 提前 将 Elixir 
目录 放 进 系统 的 环境 变量 中 。 否 则 ， 你 需要 使 用 elixir 来 执行 mix : 
$ bin/elixir bin/mix new kv --module KV 


你 也 可 以 用 -s 选项 来 执行 elixir， 它 不 管 你 有 没有 把 mix 的 目录 加 入 环境 变量 : 


$ bin/elixir -S mix new kv --module KV 


1.2- 工 程 的 编译 


一 个 名 叫 mix.exs 的 文件 会 被 自动 创建 在 工程 目录 中 。 它 的 主要 作用 是 配置 你 的 工程 。 它 的 
内 容 如 下 〈 略 去 代码 中 的 注释 ) 


defmodule KV.Mixfile do 
use Mix.Project 


def project do 
[app: :kv, 
version: "0.0.1", 
elixir Wee al 
build_embedded: Mix.env == :prod, 
start_permanent: Mix.env == :prod, 
deps: deps] 

end 


def application do 
[applications: [:logger]] 
end 


defp deps do 


我 们 的 mix.exs 定义 了 两 个 公共 函数 : 一 个 是 project ， 它 返回 工程 的 配置 信息 ， 如 工程 名 
称 和 版 本 ; 另 一 个 是 application ， 它 用 来 生成 应 用 程序 文件 a 


RA AFA RAH deps ° CH project 函数 调用 ， 里 面 定 义 了 工程 的 依赖 。 不 一 定 非 
要 把 deps 定义 为 一 个 独立 的 函数 ， 但 是 这 样 做 可 以 使 工程 的 配置 文件 看 起 来 整洁 美观 。 


Mix 还 生成 了 文件 libskv.ex ， 其 内 容 是 个 简单 的 模块 定义 : 


defmodule KV do 
end 


以 上 这 个 结构 就 足以 编译 我 们 的 工程 了 : 


$ cd kv 
$ mix compile 


将 生成 : 


Compiled lib/kv.ex 
Generated kv app 
Consolidated List.Chars 
Consolidated Collectable 
Consolidated String.Chars 
Consolidated Enumerable 
Consolidated IEx.Info 
Consolidated Inspect 


注意 文件 1ib/kv.ex 被 编译 ， 生 成 了 程序 manifest 文 件 : kv.app 及 一 些 协议 (参考 入 门 手 
册 )。 根 据 mix.exs 的 配置 ， 所 有 编译 产 出 被 放 在 _build 目录 中 。 


一 旦 工程 被 编译 成 功 ， 便 可 以 从 工程 目录 启动 一 个 iex 会 话 : 


$ iex -S mix 


1.3- 执 行 测试 


Mix 还 生成 了 合适 的 文件 结构 ， 来 测试 我 们 的 工程 。Mix 工 程 一 般 沿 用 一 些 命名 规则 : 

test 目录 中 ， 测 试 文件 一 a. <filename>_test.exs 模式 命名 。 每 一 个 <filename> 对 应 一 
lib 目录 中 的 文件 名 。 根据 这 个 命名 规则 ， 我 们 已 经 有 了 测试 libykv.ex 所 需 

的 test/kv_test.exs 文件 。 只 是 目前 它 几 乎 什么 也 没 做 : 


defmodule KVTest do 
use ExUnit.Case 


doctest KV 

test "the truth" do 
assert 1+ 1 == 2 

end 


end 


需要 注意 几 点 : 

1. 测试 文件 使 用 的 扩展 名 (.exs) 即 Elixir 脚 本 文件 。 这 很 方便 ， 我 们 不 用 在 跑 测试 前 还 编译 一 
Ro 

2. 我 们 定义 了 一 个 测试 模块 名 为 kvTest ， 用 Exunit.case 来 注入 测试 AP|， 并 使 用 
宏 test/2 定义 了 一 个 简单 的 测试 ; 


Mix 还 生成 了 一 个 文件 名 叫 test/test_helper.exs ， 它 负责 设置 测试 框架 : 
ExUnit.start() 
每 次 Mix 执 行 测试 时 ， 这 个 文件 将 自动 被 导入 (required) 。 执 行 测试 ， 使 用 命令 mix test 


Compiled lib/kv.ex 
Generated kv app 


eee 


Finished in 0.04 seconds (0.04s on load, 0.00s on tests) 
1 tests, © failures 


Randomized with seed 540224 


注意 ， 每 次 运行 mix test 时 ，Mix 会 重新 编译 源 文件 ， 生 成 新 的 应 用 程序 。 这 是 因为 Mix 支 持 
多 套 执行 环境 ， 我 们 稍 后 章节 会 详细 介绍 。 


另外 ，ExUnit 为 每 一 个 成 功 的 测试 结果 打印 一 个 点 ， 它 还 会 自动 随机 安排 测试 顺序 。 让 我 们 
把 测试 改 成 失败 看 看 会 发 生 啥 。 修 改 test/kv_test.exs 里 面 的 断言 ， 改 成 : 


assert 1 +1 = 3 


现在 再 次 运行 mix test (注意 这 次 没有 编译 行为 发 生 ) 


1) test the truth (KVTest) 
test/kv_test.exs:5 
Assertion with == failed 
codes TF A= 3 
Ihs: 2 
hs <3 
stacktrace: 

test/kv_test.exs:6 


Finished in 0.05 seconds (0.05s on load, ©.00@s on tests) 
1 tests, 1 failures 


ExUnit 会 为 每 个 失败 的 测试 结果 打印 一 个 详细 的 报告 。 其 内 容 包 含 了 测试 名 称 ， 失 败 的 代 
码 ， 失 败 断 言 中 == 号 的 左 值 (Ihs) 和 右 值 (rhs)。 


在 错误 提示 的 第 二 行 (测试 名 称 下 面 那 行 ) ， 是 该 测试 的 代码 位 置 。 将 这 个 位 置 作为 参数 
给 mix test 命令 ， 则 将 仅 执 行 该 条 测试 : 


$ mix test test/kv_test.exs:5 


这 个 十 分 有 用 是 吧 。 


最 后 是 关于 错误 的 追踪 栈 信息 ， 给 出 关于 测试 的 额外 信息 。 包括 测试 失败 的 地 方 ， 还 有 原文 
件 中 产生 失败 的 具体 位 置 等 。 


1.4- 环 境 
Mix 支 持 “ 环 境 " 的 概念 。 它 允许 开发 者 为 某 些 场景 定义 不 同 的 编译 等 动作 。 默认 地 ，Mix 理 解 
三 种 环境 : 


e :dev - Mix 任 务 的 默认 执行 环境 (如 编译 等 操作 ) 
e :test - mix test 使 用 的 环境 
e :prod -用 来 将 应 用 程序 发 布 到 产品 环境 


环境 配置 只 对 当前 工程 有 效 。 我 们 之 后 会 看 到 ， 向 工程 中 添加 的 依赖 默认 在 :prod 环境 下 工 
VE © 


可 以 通过 访问 mix.exs 工程 配置 文件 中 的 Mix.env 函数 定义 不 同 的 环境 配置 ， 它 会 以 原子 形 
式 返回 当前 的 环境 。 比如 我 们 用 之 于 :build_embedded 和 :start_permanent: 这 两 个 选项 : 


def project do 


build_embedded: Mix.env == :prod, 
start_permanent: Mix.env == :prod, 
| 


end 


上 面 代 码 的 含义 就 是 程序 在 :prod 环境 中 运行 的 话 ， 则 使 用 那 两 个 选项 。 


当 你 编译 代码 的 时 候 ，Elixir 把 编译 产 出 都 置 于 build 目录 。 但 是 ， 有 些 时 候 Elixir 为 了 避免 
一 些 不 必要 的 复制 操作 ， 会 在 build 目录 中 创建 一 些 链接 指向 特定 文件 而 不 是 Copy 。 

当 :build_embedded 选项 被 设置 为 true 时 可 以 制止 这 种 行为 ， 从 而 在 _build 目录 中 提供 执行 
程序 所 需 的 所 有 文件 。 


类 似 地 ， 当 :start_permanent 选项 设置 为 true 的 时 候 ， 程 序 会 以 "Permanent 模 式 " 执 行 。 意思 
是 如 果 你 的 程序 的 监督 树 挂 掉 ，Erlang 庶 拟 机 也 会 挂 掉 。 注意 在 :dev 和 :test 环 境 中 ， 我 们 可 
能 不 需要 这 样 的 行为 。 因为 在 这 些 环境 中 ， 为 了 troubleshooting 等 目的 ， 需 要 保持 虚拟 机 持 


Mix 黑 认 使 用 :dev 环境 ， 除 非 在 执行 测试 时 需要 用 到 :test 环境 。 环境 可 以 随时 更 改 : 


$ MIX_ENV=prod mix compile 


或 在 Windows 上 : 


> set /a "MIX_ENV=prod" && mix compile 


1.5- 探 索 


关于 Mix， 内 容 还 有 很 多 ， 我 们 在 编写 这 个 工程 的 过 程 中 还 会 陆续 接触 到 一 些 。 详细 信息 可 以 
参考 Mix 的 文档 。 


记 住 ， 你 可 以 使 用 mix 的 帮助 信息 来 帮助 理解 一 些 任务 的 操作 方法 ， 如 : 


$ mix help TASK 


2-Agent 
本 章 我 们 将 创建 一 个 名 为 kv.Bucket 的 模块 。 这 个 模块 负责 存储 可 被 不 同 进程 读 写 的 键 值 
对 o 


如 果 你 跳 过 了 “入 门 "手册 ， 或 者 是 太 久 以 前 读 的 ， 那 么 建议 你 最 好 重新 闻 读 一 下 关于 进程 的 
那 一 章 。 它 是 本 节 所 内 容 的 起 点 。 


2.1-1 5 69 AXA 
Elixir 是 一 种 * (变量 值 ) 不 可 变 ” 的 语言 。 默 认 情 况 下 ， 没 有 什么 是 被 共享 的 。 如 果 想 要 提供 
某 种 状态 ， 通 过 其 创建 可 以 从 不 同 地 方 访问 的 “ 桶 ”， 我们 有 两 种 选择 : 


。 进程 

e ETS (Erlang Term Storage) 
我 们 之 前 介绍 过 进程 ， 但 ETS 是 个 新 东西 ， 在 后 面 的 章节 中 再 去 探讨 。 而 当 用 到 进程 时 ， 我 
们 很 少 会 去 自己 动手 从 底层 做 起 ， 而 是 用 Elixir 和 OTP 中 抽象 出 来 的 东西 代替 : 

e Agent- 对 状态 简单 的 封装 

e GenServer - “通用 的 服务 器 ” (进程 ) 。 它 封装 了 状态 ， 提 供 了 同步 或 异步 调用 ， 支 持 代 

码 热 更 新 等 等 

e GenEvent - “通用 的 事件 "管理 器 ， 人 允许 向 多 个 接收 者 发 布 事件 消息 

e Task - 计算 处 理 的 异步 单元 ， 可 以 派生 出 进程 并 稍 后 收集 计算 结果 
我 们 在 本 “ 进 阶 ”手册 中 会 逐一 讨论 这 些 抽象 物 。 记 住 它们 都 是 在 进程 基础 上 实现 的 ， 使 用 
Erlang 虚 拟 机 提供 的 基本 特性 ， 如 send ， receive ， spawn 和 link ° 


2.2-Agents 


Agent 是 对 状态 简单 的 封装 。 如 果 你 想 要 一 个 可 以 保存 状态 的 地 方 (进程 ) ， 那 么 Agent 就 是 
不 二 之 选 。 让 我 们 在 工程 里 启动 一 个 iex 对 话 : 


$iex -S mix 


然后 "玩弄 "一 下 Agent : 


iex> {:ok, agent} = Agent.start_link fn -> [] end 
{:ok, #PID<0.57.0>} 

iex> Agent.update(agent, fn list -> ["eggs"|list] end) 
:Ok 

iex> Agent.get(agent, fn list -> list end) 


["eggs"] 
iex> Agent.stop(agent) 
:Ok 


这 里 用 某 个 初始 状态 ( 空 列表 ) 启动 了 一 个 agent， 然 后 执行 了 一 个 命令 来 修改 这 个 状态 ， 加 
了 一 个 新 的 列表 项 到 头 部 。 Agent.update/3 的 第 二 个 参数 是 一 个 匿名 函数 : 它 使 用 agent 当 
前 状态 为 输入 ， 返 回想 要 的 新 状态 。 最 终 我 们 获取 整个 列表 。 Agent.get/3 函数 的 第 二 个 参 
数 是 个 匿名 函数 : 它 使 用 当前 状态 为 输入 ， 返 回 的 值 就 是 Agent.get/3 的 返回 值 。 一 旦 我 们 
用 完 agent， 我 们 调用 Agent.stop/1 来 终止 agent 进 程 。 


现在 我 们 用 Agent 来 实现 kv.Bucket 。 当 时 在 开始 之 前 ， 我们 先 写 些 测试 。 新 建文 
件 test/kv/bucket_test.exs (回想 一 下 .eXS 文件 ) ARA: 


defmodule KV.BucketTest do 
use ExUnit.Case, async: true 


test "stores values by key" do 
{:ok, bucket} = KV.Bucket.start_link 
assert KV.Bucket.get(bucket, "milk") == nil 


KV.Bucket.put(bucket, "milk", 3) 
assert KV.Bucket.get(bucket, "milk") == 3 
end 
end 


我 们 的 第 一 条 测试 很 直 白 : 启动 一 个 kv.Bucket ， 然 后 执行 get/2 和 put/2 操作 。 最 后 判断 
结果 。 我 们 不 需要 显 式 地 停止 agent 进 程 。 因为 该 test 里 面 用 到 的 agent 进 程 是 链接 到 测试 进程 
的 ， 测 试 进程 一 结束 它 就 会 跟着 结 


同时 还 要 注意 我 们 向 Exunit.case 传递 了 一 个 async:true 的 选项 。 这 个 选项 使 得 该 测试 用 例 

与 其 它 同样 包含 :async 选项 的 测试 用 例 并 行 执 行 。 这 种 方式 能 够 更 好 地 利用 计算 机 多 核 的 能 
力 。 但 要 注意 ， 这 样 的 话 ， 测 试用 例 不 能 依赖 或 改变 菜 些 全 局 的 值 。 比 如 测试 需要 向 文件 系 

统 里 写 入 文字 ， 或 者 注册 进程 ， 或 者 访问 数据 库 等 。 你 在 放置 asyn 标记 前 必须 考虑 会 不 会 
在 两 个 测试 之 间 造 成 资源 竞争 。 


不 管 是 不 是 异步 执行 的 ， 很 明显 我 们 的 测试 会 失败 ， 因 为 该 实现 的 功能 一 个 都 没 实现 。 


为 了 修复 失败 的 用 例 ， 我 们 来 创建 文件 lib/kv/bucket.ex ， 输 入 以 下 内 容 。 你 可 以 不 看 下 方 
的 代码 ， 自 己 随便 尝试 着 创建 agent 的 行为 : 


defmodule KV.Bucket do 
@doc nun 
Starts a new bucket. 


def start_link do 
Agent.start_link(fn -> %{} end) 
end 


@doc nun 
Gets a value from the `bucket`ò by `key`. 


def get(bucket, key) do 
Agent.get(bucket, &Map.get(&1, key)) 
end 


@doc nun 
Puts the ‘value for the given key in the `bucket`. 


def put(bucket, key, value) do 
Agent.update(bucket, &Map.put(&1, key, value)) 
end 
end 


我 们 使 用 图 (Map) 来 存储 我 们 的 键 和 值 。 函 数 捕 提 符号 & 在 《入 门 》 中 介绍 过 。 现 
在 kv.Bucket 模块 定义 好 了 ， 测 试 都 通过 了 | 你 可 以 执行 mix test 试 试 。 


2.3-ExUnit © 74) $% žr 


在 继续 为 kv.Bucket 加 入 更 多 功能 之 前 ， 先 讲 一 讲 ExUnit 的 回调 函数 。 你 可 能 已 经 想到 ， 每 
一 个 kv.Bucket 的 测试 用 例 都 需要 用 到 bucket。 它 要 在 该 测试 用 例 启 动 时 设置 好 ， 还 要 在 该 
测试 用 例 结束 时 停止 。 幸运 的 是 ，ExUnit 支 持 回 调 函 数 ， 使 我 们 跳 过 这 重复 机 械 的 任务 


让 我 们 使 用 回调 机 制 重 写 刚 才 的 测试 : 


defmodule KV.BucketTest do 
use ExUnit.Case, async: true 


setup do 
{:ok, bucket} = KV.Bucket.start_link 
{:ok, bucket: bucket} 

end 


test "stores values by key", %{bucket: bucket} do 
assert KV.Bucket.get(bucket, "milk") == nil 


KV.Bucket.put(bucket, "milk", 3) 
assert KV.Bucket.get(bucket, "milk") == 3 


end 
end 


我 们 首先 利用 setup/1 宏 ， 创 建 了 设置 bucket 的 回调 函数 。 这 个 函数 会 在 每 条 测试 用 例 执 行 
前 被 执行 一 次 ， 并 且 是 与 测试 在 同一 个 进程 里 。 


注意 我 们 需要 一 个 机 制 来 传递 创建 好 的 bucket 的 pid 给 测试 用 例 。 我 们 使 用 测试 上 下 文 来 达 
到 这 个 目的 。 当 在 回调 函数 里 返回 {:ok，bucket: bucket} 的 时 候 ，ExUnit 会 把 该 返回 值 元 祖 
(字典 ) 的 第 二 个 元 素 merge 进 测试 上 下 文中 。 测试 上 下 文 是 一 个 图 ， 我 们 可 以 在 测试 用 例 


的 定义 中 匹配 它 ， 从 而 获取 这 个 上 下 文 的 值 给 用 例 中 的 代码 使 用 : 


test "stores values by key", %{bucket: bucket} do 
# ~bucket~ is now the bucket from the setup block 
end 


更 多 信息 可 以 参考 ExUnit.Case 模 块 文档 ， 以 及 回调 函数 。 


2.4- 其 它 Agent 行 为 


除了 “ 读 取 ”或 者 “修改 "agent 的 状态 ，agent 还 允许 我 们 使 用 函数 Agent.get_and_update/2“ 读 取 
并 修改 " 它 维持 的 状态 。 我 们 用 这 个 函数 来 实现 删除 kv.Bucket.delete/2 功能 --- 从 bucket 中 出 
除 一 个 值 ， 并 返回 该 值 : 


@doc nun 
Deletes “key from “bucket. 


Returns the current value of key , if key exists. 


def delete(bucket, key) do 
Agent.get_and_update(bucket, &Map.pop(&1, key) ) 
end 


现在 轮 到 你 来 给 上 面 的 代码 写 个 测试 啦 。 你 可 以 阅读 Agent 模 块 的 文档 获取 更 多 信息 。 


2.5-Agent 中 的 CS 模式 


在 进入 下 一 章 之 前 ， 让 我 们 讨论 一 下 agent 中 的 C/S 二 元 模式 。 先 来 展开 刚刚 写 好 
的 delete/2 函数 : 


def delete(bucket, key) do 
Agent.get_and_update(bucket, fn dict-> 
Map.pop(dict, key) 
end) 
end 


我 们 传递 给 agent 的 函数 中 的 任何 东西 ， 都 会 出 现在 agent 的 进程 里 。 在 这 里 ， 因 为 agent 进 程 
负责 接收 和 回复 我 们 的 消息 ， 因 此 可 以 说 agent 进 程 就 是 个 服务 器 (服务 端 ) 。 而 那个 方法 之 
外 的 任何 东西 ， 都 被 看 成 是 在 客户 端的 范围 内 。 


= 


aaa 


这 个 区 别 很 重要 。 如 果 有 大 量 的 工作 要 做 ， 你 必须 考虑 这 个 工作 是 放 在 客户 端 还 是 在 服务 
上 执行 。 比 如 : 


def delete(bucket, key) do 
i:timer.sleep(1000) # puts client to sleep 
Agent.get_and_update(bucket, fn dict -> 
i:timer.sleep(1000) # puts server to sleep 
Map.pop(dict, key) 
end) 
end 


当 服 务 器 上 执行 一 个 很 耗 时 的 工作 时 ， 所 有 其 它 对 该 服务 器 的 请 求 都 必须 等 待 ， 直 到 那个 工 
作 完 成 。 这 会 造成 客户 端的 超时 。 


下 一 章 我 们 会 探索 通用 服务 器 GenServer， 它 在 概念 上 对 服务 器 与 客户 端的 隔离 更 明显 。 


通用 服务 器 (GenServer ) 


上 一 章 我 们 用 agent 实 现 了 buckets。 根 据 第 一 章 所 描述 的 ， 我 们 的 设计 是 要 给 每 个 bucket 赋 子 
名 字 ， 从 而 可 以 这 么 去 访问 : 


CREATE Shopping 
OK 


PUT shopping milk 1 
OK 


GET shopping milk 


1 
OK 


Bi wegen at te ae tbuckel A tar eid pid): tee a? ea ON ah) 
进程 那 章 中 提 到 过 ， 我 们 可 以 给 进程 注册 名 字 。 我 们 貌似 可 以 使 用 这 个 方法 来 给 bucket 起 


iex> Agent.start_link(fn -> [] end, name: :shopping) 


{:ok, #PID<0.43.0>} 
iex> KV.Bucket.put(:shopping, "milk", 1) 
:Ok 
iex> KV.Bucket.get(:shopping, "milk") 
all 
但 是 这 是 个 很 差 的 主意 ! 在 Elixir 中 ， 进 程 的 名 字 存 储 为 原子 。 这 意味 着 我 们 从 外 部 客户 端 输 


本 ， 都 会 被 转换 成 原子 。 记 住 ， 绝 对 不 要 把 用 户 输入 转换 为 原子 。 这 是 因为 原 
子 不 会 被 垃圾 收集 器 收集 。 一 旦 原子 被 创建 ， 它 就 不 会 被 取消 (你 也 没 法 主动 释放 一 个 原 
子 ， 对 吧 ) 。 使 用 用 户 输入 生成 原子 就 意味 着 用 户 可 以 播 入 足够 不 同 的 名 字 来 耗 尽 系统 内 存 
空间 ! 

在 实际 操作 中 ， 在 它 用 完 内 存 之 前 会 先 触 及 Erland 虚 拟 机 的 最 大 原子 数量 ， 从 而 造成 系统 崩 
im ° 

比 起 滥用 名 字 注 册 机 制 ， 我 们 可 以 创建 我 们 自己 的 注册 表 进 程 (registry process) 来 维护 一 个 
字典 ， 用 该 字典 联系 起 每 个 bucket 的 名 字 和 进程 。 


这 个 注册 表 要 能 够 保证 永远 处 于 最 新 状态 。 如 果 有 一 个 bucket 进 程 因 故 崩 演 ， 注 册 表 必须 清 
除 该 进程 信息 ， 以 防止 继续 服务 下 次 查找 请 求 。 在 Elixir 中 ， 我 们 描述 这 种 情况 会 说 “该 注册 
表 需 要 监视 (monitor) 每 个 bucket”。 


我 们 将 使 用 GenServer 来 创建 一 个 可 以 监视 bucket 进 程 的 注册 表 进 程 。 


在 Elixir 和 OTP 中 ，GenServer 是 创建 “通用 的 服务 器 (generic servers) "的 首选 抽象 物 。 


3.1- 第 一 个 GenServer 


一 个 GenServer 实 现 分 为 两 个 部 分 : 客户 端 API 和 服务 端 回调 函数 。 这 两 部 分 可 以 写 在 同 
模块 里 ， 也 可 以 分 开 写 到 两 个 模块 中 。 客户 端 和 服务 端 a 
数 来 与 服务 端 来 回 传递 消息 。 方便 起 见 ， 这 里 我 们 将 这 两 部 分 写 在 一 个 模块 中 。 创建 文 

件 lib/kv/registry.ex ， 包 含 以 下 内 容 : 


defmodule KV.Registry do 
use GenServer 


## Client API 


@doc nun 

Starts the registry. 

def start_link() do 
GenServer.start_link(__MODULE__, :ok, []) 

end 





@doc nun 
Looks up the bucket pid for name stored in ‘server’. 


Returns ok pid} if the bucket exists, error otherwise. 
def lookup(server, name) do 

GenServer.call(server, {:lookup, name}) 
end 


@doc nun 
Ensures there is a bucket associated to the given “name” in server : 
nun 
def create(server, name) do 
GenServer.cast(server, {:create, name}) 
end 


## Server Callbacks 


def init(:ok) do 
{:0k, %{}} 


end 


def handle_call({:lookup, name}, _from, names) do 
{:reply, Map.fetch(names, name), names} 
end 


def handle_cast({:create, name}, names) do 
if Map.has_key?(names, name) do 
{:noreply, names} 
else 
{:ok, bucket} = KV.Bucket.start_link() 
{:noreply, Map.put(names, name, bucket)} 
end 
end 
end 


第 一 个 函数 是 start_link/o ， 它 传递 三 个 参数 启动 了 一 个 新 的 GenServer : 
1. 实现 了 服务 器 回调 函数 的 模块 名 称 。 这 里 的 ”MopULE 指 的 是 当前 模块 
2. 初始 参数 ， 这 里 是 :ok 
3. 一 组 选项 列表 ， 比 如 可 以 存放 服务 器 的 名 字 。 这 里 用 个 空 列 表 


你 可 以 向 一 个 GenServer 发 送 两 种 请 求 : call 和 cast ° Call 是 同步 的 ? 服务 器 必须 发 送 
回复 给 该 类 请 求 。Cast 是 异步 的 ， 服 务 器 不 会 发 送 回复 消息 。 


再 往 下 的 两 个 方法 ， lookup/2 和 create/2 ， 它 们 用 来 发 送 这 些 请 求 给 服务 器 。 这 两 种 请 
求 ， 会 被 第 一 个 参数 所 指认 的 服务 器 中 的 handle_call/3 和 handle_cast/2 函数 处 理 〈 因 此 你 
的 服务 器 回调 函数 必须 包含 这 两 个 函数 ) 。 GenServer.call/2 和 GenServer.cast/2 除了 指认 
服务 器 之 外 ， 还 告诉 服务 器 它们 要 发 送 的 请 求 。 这 个 请 求 存储 在 元 组 里 ， 这 里 

BP {:lookup, name} 和 {:create, name} ， 在 下 面 写 相 应 的 回调 处 理 函 数 时 会 用 到 。 这 个 消息 
元 组 第 一 个 元 素 一 般 是 要 服务 器 做 的 事 儿 ， 后 面 的 元 素 就 是 该 动作 的 参数 。 


在 服务 器 这 边 ， 我 们 要 实现 一 系列 服务 器 回调 函数 来 实现 服务 器 的 启动 、 停 止 以 及 处 理 请 求 
等 。 回 调 防 数 是 可 选 的 ， 我 们 在 这 里 只 实现 所 关心 的 那 几 个 。 


第 一 个 是 init/1 回调 函数 ， 它 接受 一 个 状态 参数 (你 在 用 户 APl 中 调 

用 GenServer.start_link/3 中 使 用 的 那个 ) > AE {:ok, state} ° 这 里 state 是 一 个 新 建 的 
图 map。 我 们 现在 已 经 可 以 观察 到 ，GenServer 的 API 中 ， 客 户 端 和 服务 器 之 间 的 界限 十 分 明 
显 。 start_link/3 在 客户 端 发 生 。 而 其 对 应 的 init/1 在 服务 器 端 


(KX 
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对 于 call 请 求 ， 我 们 在 服务 器 端 必 须 实 现 handle_call/3 回调 函数 。 参数 : 接收 某 请 求 (M 
个 元 组 ) 、 请 求 来 源 ( _from ) 以 及 当前 服务 器 状态 ( names ) ° handle_call/3 函数 返回 一 
个 {:reply, reply, new_state} 元 组 。 其 中 ” reply 是 你 要 回复 给 客户 端的 东西 ， 

而 new_statue 是 新 的 服务 器 状态 。 


对 于 cast 请 求 ， 我 们 必须 实现 一 个 handle_cast/2 回调 函数 ， 接 受 参 数 : request 以 及 当前 
服务 器 状态 ( names ) 。 这 个 函数 返回 {:noreply, new_state} 形 式 的 元 组 2 


这 两 个 回调 函数 ，handle_call/3 和 handle_cast/2 还 可 以 返回 其 它 几 种 形式 的 元 组 。 还 有 另 


还 
外 几 种 回调 函数 ， 如 terminate/2 和 code_change/3 等 2 可 以 参考 完整 的 GenServer 文 档 来 学 
习 相 关 知 识 。 


现在 ， 来 写 几 个 测试 来 保证 我 们 这 个 GenServer 可 以 执行 预期 工作 。 
3.2- 测 试 一 个 GenServer 


测试 一 个 GenServer 比 起 测试 agent 没 有 多 少 区 别 。 我 们 在 测试 的 setup 回 调 中 启动 该 服务 器 进 
程 用 以 测试 。 用 以 下 内 容 创 建 测试 文件 test/kv/registry_test.exs 


defmodule KV.RegistryTest do 
use ExUnit.Case, async: true 


setup do 
{:ok, registry} = KV.Registry.start_link 
{:ok, registry: registry} 

end 


test "spawns buckets", %{registry: registry} do 
assert KV.Registry.lookup(registry, "shopping") == :error 


KV.Registry.create(registry, "shopping") 
assert {:ok, bucket} = KV.Registry.lookup(registry, "shopping" ) 


KV.Bucket.put(bucket, "milk", 1) 
assert KV.Bucket.get(bucket, "milk") == 1 
end 
end 


哈 ， 居 然 都 过 了 


我 们 不 用 显 式 关闭 注册 表 进 程 ， 因 为 在 测试 执行 完 的 时 候 它 会 自动 收 到 :shutdown 信号 。 这 
个 方法 对 于 测试 是 还 好 啦 。 如 果 你 想 在 GenServer 的 处 理 逻 辑 里 加 上 关于 停止 的 方法 ， 我 们 
可 以 使 用 GenServer.stop/1 函数 : 


## Client API 
@doc nun 
Stops the registry. 


def stop(server) do 
GenServer .stop(server) 
end 


3.3- 监 控 需 求 


至 此 我 们 的 注册 表 完 成 的 差不多 了 ， 剩 下 的 问题 就 要 解决 在 enue 溃 的 时 候 注 册 表 失去 
时 效 的 问题 。 比如 给 kv.RegistryTest 增加 一 个 测试 来 暴露 这 个 问题 : 


test "removes buckets on exit", %{registry: registry} do 
KV.Registry.create(registry, "shopping") 
{:ok, bucket} = KV.Registry.lookup(registry, "shopping") 
Agent.stop(bucket ) 
assert KV.Registry.lookup(registry, "“shopping") == ‘error 
end 


这 个 测试 会 在 最 后 一 个 断言 处 失败 。 因 为 当 我 们 停止 了 bucket 进 程 后 ， 该 bucket 名 字 还 存在 于 
注册 表 中 。 


为 了 解决 这 个 bug， 我 们 需要 注册 表 能 够 监视 它 派生 出 的 每 一 个 bucket 进 程 。 一 旦 我 们 创建 了 
监视 器 ， 注 册 表 将 收 到 每 个 bucket 退 出 的 通 。 这 样 它 就 可 以 清理 bucket 映 射 字典 了 


我 们 先 在 命令 行 中 玩弄 一 下 监视 机 制 。 启 动 iex -S mix 


iex> {:ok, pid} = KV.Bucket.start_link 

{:ok, #PID<0.66.0>} 

iex> Process.monitor(pid) 

#Reference<0.0.0.551> 

iex> Agent.stop(pid) 

:OK 

iex> flush() 

{:DOWN, #Reference<0.0.0.551>, :process, #PID<0.66.0>, :normal} 


注意 Process.monitor(pid) 返回 一 个 唯一 的 引用 ， 使 我 们 可 以 通过 这 个 引用 找到 其 指 代 的 监 
BEANE” RANMA E KETAM 和 
到 一 个 :DowN 消息 ， 内 含 一 个 监视 器 返回 的 引用 。 它 表示 有 个 bucket 进 程 退 出 ， 原 因 


是 ‘normal ° 
现在 让 我 们 重新 实现 下 服务 器 回调 函数 。 


首先 ， allie wipes 改 成 两 个 字典 : 一 个 用 ae name->pid 映射 关系 ， 另 一 个 存 
tk ref->name 关系 。 后 在 handle_cast/2 中 加 入 监视 器 ， 并 且 实 现 一 个 handle_info/2 回调 
函数 用 来 保存 监视 消息 总 errer rey ir: 


## Server callbacks 


def init(:ok) do 
names = %{} 


refs = %{} 
{:ok, {names, refs}} 
end 


def handle_call({:lookup, name}, _from, {names, _} = state) do 
{:reply, Map.fetch(names, name), state} 
end 


def handle_cast({:create, name}, {names, refs}) do 
if Map.has_key?(names, name) do 
{:noreply, {names, refs}} 
else 
{:ok, pid} = KV.Bucket.start_link() 
ref = Process.monitor(pid) 
refs = Map.put(refs, ref, name) 
names = Map.put(names, name, pid) 
{:noreply, {names, refs}} 
end 
end 


def handle_info({:DOWN, ref, :process, _pid, _reason}, {names, refs}) do 
{name, refs} = Map.pop(refs, ref) 
names = Map.delete(names, name) 
{:noreply, {names, refs}} 

end 


def handle_info(_msg, state) do 


{:noreply, state} 
end 


看 得 出 来 ， 我 们 在 没有 修改 客户 端 API 情 况 下 修改 了 服务 器 的 实现 。 这 就 体现 出 了 GenServer 
将 客户 端 与 服务 器 隔离 开 的 好 处 。 


， 不 同 TE ae ， RANT LT — NRA A handle_info/2 的 函数 子 句 
Crk A 其 意 类 似 重 载 的 函数 的 一 条 实现 ) 。 它 丢弃 那些 不 知道 也 用 不 着 的 消 
g&o 下面 一 节 来 解释 下 为 哈 。 


3.4-call ，cast 还 是 info ? 


到 目前 为 止 ， 我 们 已 经 使 用 了 三 个 服务 器 回调 函数 : handle call/3 ， handle_cast/2 
和 handle_info/2 。 何 时 使 用 哪个 ， 其 实 很 直 白 : 


1. handle call/3 用 来 处 理 同 步 请 求 。 这 是 软 认 的 处 理 方式 ， 因 为 等 待 服务 器 回复 是 十 分 
有 用 的 “压力 反 转 (backpressure， 涉 及 |O 优 化， 请 自行 搜索 ) "机 制 。 

2. handle_cast/2 用 来 处 理 异 步 请 求 ， 当 你 无 所 谓 要 不 要 个 回复 时 ° 一 个 cast 请 求 甚 至 不 保 
证 服务 器 收 到 了 该 请 求 ， 因 此 请 有 节制 地 使 用 。 例如， 我 们 定义 的 create/2 函数 应 该 使 
用 call 的 ， 而 我 们 用 cast 只 是 为 了 演示 目的 。 

3. handle_info/2 用 来 接收 和 处 理 服务 器 收 到 的 其 它 ( 既 不 是 Genserver.call/3 也 不 
是 Genserver.cast/2 ) 请 求 。 它 可 以 接受 是 以 普通 进程 身份 通过 send/2 收 到 的 消息 或 
者 其 它 消 息 。 监 视 器 发 来 的 :DowN 消息 就 是 个 极 好 的 例子 


因为 任何 消息 ， 包 括 通过 send/2 发 送 的 消息 ， 回 去 到 handle_info/2 处 理 ， ee 
你 不 需要 的 消息 跑 进 服务 器 。 如 果 不 定 义 一 个 “捕捉 所 有 消息 ”的 函数 子 句 ， 这 些 消息 会 导致 
我 们 的 监督 者 进程 (supervisor) Hit > A A AA BAF LREM © 


我 们 不 需要 为 handle_call/3 和 handle cast/2 担心 这 个 情况 ， 因 为 它们 能 接受 的 请 求 都 是 通 
过 GenServer 的 API 发 送 的 ， 要 是 出 了 毛病 就 是 程序 员 自 己 犯错 。 


3 还 是 链接 ? 


我 们 之 前 在 进程 那 章 里 的 学 习 过 链接 (links) 。 现 在 ， 随 着 注册 表 的 完工 ， 你 也 许 会 问 : 我 
们 哈 时 候 用 监控 器 ， 哈 时 候 用 链接 呢 ? 


3.5- 监 视 


链接 是 双向 的 。 你 将 两 个 进程 链接 起 来 ， 其 中 一 个 挂 了 ， ears (除非 它 处 理 了 该 异 
常 ， 改 变 了 行为 ) 。 而 监视 机 和 是 单 向 的 : 只 有 监视 别人 的 进程 会 收 到 被 监视 的 进程 的 消 
息 。 简 单 说 ， 当 你 想 让 某 些 进程 一 挂 都 挂 时 ， 使 用 链接 ; a 导 到 进程 退出 或 挂 了 等 事件 
的 消息 通知 ， 使 用 监视 。 


回 到 我 们 handle cast/2 的 实现 ， 你 可 以 看 到 注册 表 是 同时 链接 着 且 监 视 着 派生 出 的 bucket : 


{:ok, pid} = KV.Bucket.start_link() 
ref = Process.monitor(pid) 


这 是 个 坏 主意 。 我 们 不 想 注 册 表 进程 因为 某 个 bucket 进 程 挂 而 一 同 挂 掉 ! 我 们 将 在 讲解 监督 
# (supervisor) 时 探索 更 好 的 解决 方法 。 一 句 话 概括 ， 我 们 将 不 直接 创建 新 的 进程 ， 而 是 将 
把 这 个 责任 委托 给 监督 者 。 就 像 我 们 即将 看 到 的 那样 ， 监 督 者 同 链接 工作 在 一 起 ， 这 就 解释 
了 为 啥 基于 链接 的 API (如 spawn_link ， start_link +) 在 Elixir 和 OTP 上 十 分 流行 。 


在 讲 监 督 者 之 前 ， 我 们 首先 探索 下 使 用 GenEvent 进 行事 件 管理 以 和 处 理 的 知识 。 


4-GenEvent 
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事件 管理 
注册 表 进 程 的 事件 
事件 流 


注 : Elixir v1.1 发 布 后 本 章 内 容 被 从 官方 入 门 手册 中 拿 掉 了 。 这 里 留存 ， 如 果 仍 需 使 用 
GenEvent， 可 以 查阅 。 大 家 可 以 暂时 跳 过 这 一 章 。 


探索 GenEvent，Elixir 和 OTP 提 供 的 又 一 个 行为 抽象 。 它 允许 我 们 派生 一 个 事件 管理 器 ， 
用 来 向 多 个 处 理 者 发 布 事件 消息 。 


我 们 会 激发 两 种 事件 : 一 个 是 每 次 bucket 被 加 到 注册 表 ， 另 一 个 是 从 注册 表 中 移 除 。 


4.1- 事 件 管理 器 
打开 一 个 新 iex -s mix 对 话 ， 玩 型 一 下 GenEvent 的 API : 


iex> {:ok, manager} = GenEvent.start_link 
{:ok, #PID<0.83.0>} 

iex> GenEvent.sync_notify(manager, :hello) 
:Ok 

iex> GenEvent.notify(manager, :world) 

:Ok 


函数 GenEvent.start_link/o 启动 了 一 个 新 的 事件 管理 器 。 不 需 额 外 的 参数 i 管理 器 & 6 建 好 
后 ， 我 们 就 可 以 调用 GenEvent.notify/2 函数 和 GenEvent.sync_notify/2 函数 来 发 送 通知 。 


但 是 ， 当 前 还 没有 任何 消息 处 理 者 绑 定 到 该 管理 器 ， 因 此 不 管 它 发 哈 通 知 ， 叫 破 路 叶 都 不 会 
有 事 儿 发 生 。 


现在 就 在 iex 对 话 里 创建 第 一 个 事件 处 理 器 : 


iex> defmodule Forwarder do 


> use GenEvent 

Rane def handle_event(event, parent) do 

eae send parent, event 

> {:ok, parent} 

T end 

..> end 

iex> GenEvent.add_handler(manager, Forwarder, self()) 
:Ok 
iex> GenEvent.sync_notify(manager, {:hello, :world}) 
:Ok 


iex> flush 
{:hello, :world} 
:ok 


我 们 创建 了 一 个 处 理 器 (handler) ， 并 通过 函数 Genevent.add_handler/3 把 它 “ 绑 定 ? 到 事件 管 
理 器 上 ， 传 递 的 三 个 参数 是 : 


1， 刚 启动 的 那个 时 间 管 理 器 
2. 定义 事件 处 理 者 的 模块 (如 这 里 的 Forwarder ) 
3. 事件 处 理 者 的 状态 : 在 这 里 ， 使 用 当前 进程 的 id 


加 上 这 个 处 理 器 之 后 ， 可 以 看 到 ， 调 用 了 sync_notify/2 之 后 ， Forwarder 处 理 器 成 功 地 把 事 
件 转 给 了 它 的 父 进 程 (IEx) ， 因 此 那个 消息 进入 了 我 们 的 收 件 箱 。 


这 里 有 几 点 需要 注意 : 


1， 事 件 处 理 器 运行 在 事件 管理 器 的 同一 个 进程 里 
2. sync_notify/2 同步 地 运行 事件 处 理 器 处 理 请 求 
3. notify/2 使 事件 处 理 器 异步 处 理 请 求 


这 里 sync_notify/2 和 notify/2 类 似 于 GenServer 里 面 的 call/2 和 cast/2 ° 推荐 使 
用 sync_ we o 它 以 反 向 压力 的 机 制 工 作 ， 减 少 了 “发 消息 速度 快 过 消息 被 成 功 分 发 的 速 
度 "的 可 能 性 。 


记得 去 GenServer 的 模块 文档 阅读 其 它 函 数 。 目 前 我 们 的 程序 就 用 提 到 的 这 些 知 识 就 可 以 
Ta 


4.2- 注 册 表 进程 的 事件 


为 了 能 发 出 事件 消息 ， 我 们 要 稍微 修改 一 下 我 们 的 注册 表 进 程 ， 使 之 与 一 个 事件 管理 器 进行 
协作 。 我 们 需要 在 注册 表 进 程 启动 的 时 候 ， 事 件 管理 器 也 能 自动 启动 。 比 如 在 init/1 回调 
里 面 ， 最 好 能 传递 事件 处 理 器 KJ pid2 或 名 字 什么 的 作为 参数 来 start link ， 以 此 将 启动 事件 管 
理 器 与 注册 表 进 程 分 解 开 。 


但 是 ， 首 先 让 我 们 修改 测试 中 注册 表 进 程 的 行为 。 打 开 test/kv/registry_text.exs ， 修改 目 
前 的 setup 回调 ， 然 后 再 加 上 新 的 测试 : 


defmodule Forwarder do 
use GenEvent 


def handle_event(event, parent) do 
send parent, event 
{:ok, parent} 
end 
end 


setup do 
{:ok, manager} = GenEvent.start_link 
{:ok, registry} = KV.Registry.start_link(manager ) 


GenEvent.add_mon_handler(manager, Forwarder, self()) 


{:ok, registry: registry} 
end 


test "sends events on create and crash", %{registry: registry} do 
KV.Registry.create(registry, "shopping") 
{:ok, bucket} = KV.Registry.lookup(registry, "shopping") 
assert_receive {:create, "shopping", Abucket} 


Agent.stop(bucket ) 
assert_receive {:exit, "shopping", bucket} 
end 


为 了 测试 我 们 即将 添加 的 功能 ， 我 们 首先 定义 了 一 个 Forwarder 事件 处 理 器 ， 类 似 刚 才 在 IEx 
中 创建 的 那样 。 在 setup 中 ， 我 们 启动 了 事件 管理 器 ， 把 它 作为 参数 传递 给 了 注册 表 进 程 ， 
并 且 向 该 管理 器 添加 了 我 们 定义 的 Forwarder 处 理 器 。 至 此 ， 事 件 可 以 发 向 待 测 进程 了 。 


在 测试 中 ， 我 们 创建 、 停 止 了 一 个 bucket 进 程 ， 并 且 使 用 assert_receive 断言 来 检查 是 否 收 
到 了 :create 和 :exit 事件 消息 。 断言 assert_receive 默认 是 500 毫 秒 超时 时 间 ， 这 对 于 测 
试 足够 了 。 同样 要 指出 的 是 ， assert_receive 期 待 接收 一 个 模式 ， 而 不 是 一 个 值 。 这 就 是 为 
啥 我 们 用 ^bucket 来 匹配 bucket 的 pid (参考 《入 门 》 关 于 变量 的 匹配 内 容 ) 。 


最 终 ， 注 意 我 们 调用 了 Genevent.add_mon_handler/3 来 代替 GenEvent.add_handler/3 。 该 函数 
不 但 可 以 添加 一 个 处 理 器 ， 它 还 告诉 事件 管理 器 来 监视 当前 进程 。 如 果 当 前 进程 挂 了 ， 事 件 
处 理 器 也 一 并 抹 去 。 这 个 很 有 道理 ， 因 为 对 于 这 里 的 Forwarder ， 如 果 消 息 的 接收 方 

( self() /测试 进程 ) 终止 ， 我 们 理 所 应 当 停 止 转发 消息 。 


好 了 ， 现 在 来 修改 注册 表 进 程 代码 来 让 测试 pass。 打 开 lib/kv/registry,ex ， 输 入 以 下 新 的 
AÈ (一 些 关键 语句 的 解释 写 在 注释 里 ) 


defmodule KV.Registry do 
use GenServer 


## Client API 


@doc nun 
Starts the registry. 
def start_link(event_manager, opts \\ []) do 
# 1. start_link now expects the event manager as argument 
GenServer.start_link(__ MODULE , event_manager, opts) 
end 





@doc nun 
Looks up the bucket pid for name stored in server 


Returns ~{:ok, pid} in case a bucket exists, error otherwise. 
def lookup(server, name) do 

GenServer.call(server, {:lookup, name}) 
end 


@doc nun 
Ensures there is a bucket associated with the given name in ‘server’. 
nun 
def create(server, name) do 
GenServer.cast(server, {:create, name}) 
end 


## Server callbacks 


def init(events) do 
# 2. The init callback now receives the event manager. 


# we have also changed the manager state from a tuple 
# to a map, allowing us to add new fields in the future 
# without needing to rewrite all callbacks. 
names = HashDict.new 
refs = HashDict.new 
{:ok, %{names: names, refs: refs, events: events}} 
end 


def handle_call({:lookup, name}, _from, state) do 
{:reply, HashDict.fetch(state.names, name), state} 
end 


def handle_cast({:create, name}, state) do 
if HashDict.get(state.names, name) do 
{:noreply, state} 
else 
{:ok, pid} = KV.Bucket.start_link() 
ref = Process.monitor(pid) 
refs = HashDict.put(state.refs, ref, name) 
names = HashDict.put(state.names, name, pid) 
# 3. Push a notification to the event manager on create 
GenEvent.sync_notify(state.events, {:create, name, pid}) 
{:noreply, %{state | names: names, refs: refs}} 
end 
end 


def handle_info({:DOWN, ref, :process, pid, _reason}, state) do 
{name, refs} = HashDict.pop(state.refs, ref) 
names = HashDict.delete(state.names, name) 
# 4. Push a notification to the event manager on exit 
GenEvent.sync_notify(state.events, {:exit, name, pid}) 
{:noreply, %{state | names: names, refs: refs}} 

end 


def handle_info(_msg, state) do 
{:noreply, state} 
end 


end 


这 些 改变 很 直观 。 我 们 给 Genserver 初始 化 过 程 传 递 一 个 事件 管理 器 ， 该 管理 器 是 我 们 

用 start_link 启动 进程 时 作为 参数 收 到 的 。 我 们 还 改 了 cast 和 info 两 个 回调 ， 在 里 面 调 用 

了 GenEvent.sync_notify/2 ° 最 后 ， 我 们 借 这 个 机 会 还 把 服务 器 的 状态 改 成 了 一 个 图 ， 方 便 
我 们 以 后 改进 注册 表 进 程 。 


执行 测试 ， 都 是 绿 的 。 


4.3- 事 件 流 


最 后 一 个 值得 探索 的 GenEvent 的 功能 点 是 像 处 理 流 一 样 处 理事 件 : 


iex> {:ok, manager} = GenEvent.start_link 

{:ok, #PID<0.83.0>} 

iex> spawn_link fn -> 

> for x <- GenEvent.stream(manager), do: I0.inspect(x) 
enc 

:Ok 

iex> GenEvent.notify(manager, {:hello, :world}) 

{:hello, :world} 

:Ok 


上 面 的 例子 中 ， 我 们 创建 了 一 个 GenEvent.stream(manager) ， 返 回 一 个 事件 的 流 ( 即 一 个 
enumerable) ， 并 随即 处 理 了 它 。 处 理事 件 是 一 个 阻塞 的 行为 ， 我 们 派生 新 进程 来 处 理事 件 
消息 ， 把 消息 打印 在 终端 上 。 这 一 系列 的 操作 ， 就 像 看 到 的 那样 ， 如 实地 执行 了 。 每 次 调 
用 sync_notify/2 或 者 notify/2 ， 事 件 都 被 打印 在 终端 上 ， 后 面 跟 着 一 个 :ok (IEx 输 出 语句 
的 执行 结果 ) 。 


通常 事件 流 提供 了 足够 多 的 内 置 功 能 来 处 理事 件 ， 使 我 们 不 必 实 现 我 们 自己 的 处 理 器 。 但 
是 ， 若 是 需要 某 些 自 定义 的 功能 ， 或 是 在 测试 时 ， 定 义 自己 的 事件 处 理 器 回调 才 是 正道 。 
至 此 ， 我 们 有 了 一 个 事件 处 理 器 ， 一 个 注册 表 进 程 以 及 可 能 会 同时 执行 的 许多 bucket 进 程 ， 
是 时 候 开 始 担 心 这 些 进程 会 不 会 挂 掉 了 。 


5- 监 督 者 和 应 用 程序 


到 目前 为 止 ， 我 们 和 已 经 实现 了 注册 表 (registry) 来 对 成 百 上 千 的 bucket 进 程 进行 监 
视 。 你 是 不 是 觉得 这 个 还 不 错 ? 没有 软件 是 pug-free 的 ， 挂 掉 那 是 必定 会 发 生 滴 。 


当 有 东西 挂 了 ， 我 们 的 第 一 反应 是 :“ 快 拯救 这 些 错误 "*。 但 是 ， 像 在 《入 门 》 中 学 到 的 那样 ， 
不 同 于 其 它 多 数 语言 ，Elixir 不 te 隆 编程 *。 相反 ， 我 们 说 "要 挂 快 点 挂 ”， 或 是 "就 让 它 
JE” o Por ma 注册 表 进 程 挂 掉 ， 啥 也 别 怕 ， 因 为 我 们 即将 实现 用 监督 者 来 启动 
新 的 注册 表 进 程 副本 。 


本 章 我 们 将 学 习 监 督 者 (supervisor) ， 还 会 讲 到 些 有 关 应 用 程序 的 知识 。 一 个 不 够 ， 我 们 要 
创建 两 个 监督 者 ， 用 它们 监督 我 们 的 进程 。 


5.1- 第 一 个 监督 者 


创建 一 个 监督 者 跟 创 建 通 用 服务 器 差不多 。 我 们 将 定义 一 个 名 为 kv.supervisor 的 模块 ， 使 
用 Supervisor 行 为 。 代码 文件 1ib/kv/supervisor.ex 内 容 如 下 : 


defmodule KV.Supervisor do 
use Supervisor 


def start_link do 
Supervisor.start_link(__MODULE__, :ok) 
end 


def init(:ok) do 


children = [ 
worker(KV.Registry, [KV.Registry]) 
] 
supervise(children, strategy: :one_for_one) 
end 


end 


我 们 的 监督 者 目前 只 有 一 个 孩子 : 注册 表 进 程 。 一 个 形式 如 


worker(KV.Registry, [KV.Registry]) 


的 worker， 在 调用 : 


KV.Registry.start_link(KV.Registry) 


时 将 启动 一 个 进程 。 


我 们 传 给 start_link 的 参数 是 进程 的 名 称 。 给 监督 机 制 下 得 进程 命名 是 常见 的 做 法 ， 这 样 别 
的 进程 就 可 以 通过 名 称 访问 它们 ， 而 不 需要 知道 它们 的 进程 ID。 这 很 有 用 ， 因 为 当 被 监督 的 
eae: 填 程 ID 可 能 会 改变 。 但 是 用 名 称 就 不 一 样 了 。 我 们 可 以 保证 一 个 
挂 掉 新 局 的 进程 ， 还 会 用 同样 的 名 称 注册 进来 。 而 不 用 显 式 地 先 获取 之 前 的 进程 ID。 另外 ， 

通常 会 用 e 井 程 的 名 字 ， 在 将 来 对 系统 进行 debug 时 非常 直观 。 


后 ， 我 们 调用 了 supervisor/2 ， 给 它 传递 了 一 个 孩子 列表 以 及 策略 : :one for one ° 


监督 者 的 策略 指明 了 当 一 个 孩子 进程 挂 了 会 发 生 什 么 。 :one_for_one 意思 是 如 果 一 个 孩子 进 
程 挂 了 ， 只 有 一 个 “复制 品 "会 启动 来 蔡 代 它 。 我 们 现在 要 的 就 是 这 个 策略 ， 因 为 我 们 只 有 一 
个 孩子 。 supervisor 支持 许多 不 同 的 策略 ， 我 们 在 本 章 中 将 会 陆续 讨论 。 


ALA kv.Registry.start_link/1 现在 期 待 一 个 参数 ， 需 要 修改 我 们 的 实现 来 接受 这 一 个 参数 。 
打开 文件 lib/kv/registry.ex ， 覆盖 原来 的 start_link/e 定义 : 


@doc nun 
Starts the registry with the given “name. 
def start_link(name) do 
GenServer.start_link(__ MODULE , :ok, name: name) 
end 





我 们 还 要 修改 测试 ， 在 注册 表 进 程 语 动 时 给 个 名 字 。 在 文件 test/kv/registry_test.exs 中 入 
瘟 JR setup BARA : 


setup context do 
{:ok, registry} = KV.Registry.start_link(context.test) 
{:ok, registry: registry} 

end 


类 似 test/3 ， 函 数 setup/2 也 接受 测试 上 下 文 (context) 。 不 管 我 们 给 setup 代 码 中 添加 了 
var» 上 下 文中 包含 着 几 个 关键 变量 : 比如 icase ， :test ， :file 和 ‘line ° 上 面 代码 
中 ， 我 们 用 了 context.test 作为 捷径 取得 当前 运行 着 的 测试 名 称 ， 生 成 一 个 注册 表 进 程 。 


现在 ， 随 着 测试 通过 ， 可 以 拉 我 们 的 监督 者 出 去 溜溜 了 。 如 果 在 工程 中 尼 动 命令 行 对 
话 iex -S mix ， 我 们 可 以 手动 启动 监督 者 : 


iex> KV.Supervisor.start_link 

{:ok, #PID<0.66.0>} 

iex> KV.Registry.create(KV.Registry, "shopping") 
:Ok 

iex> KV.Registry.lookup(KV.Registry, "shopping") 
{:ok, #PID<0.70.0>} 


当 我 们 启动 监督 者 ， 注 册 表 Worker 会 自动 启动 ， 允 许 我 们 创建 bucket 而 不 需要 手动 启动 它 


但 是 ， 在 实战 中 我 们 很 少 手 动 启动 应 用 程序 的 监督 者 。 启 动 监督 者 是 应 用 程序 回调 过 程 的 一 
部 分 


5.2- 理 解 应 用 程序 


起 始 我 们 已 经 把 所 有 时 间 都 花 在 这 个 应 用 程序 上 了 。 每 次 修改 了 一 个 文件 ， 执 
行 mix compile ， 我 们 都 能 看 到 Generated kv app 消息 在 编译 信息 中 打印 出 来 。 


我 们 可 以 在 _build/dev/lib/kv/ebin/kv.app 找到 .app 文件 。 来 看 一 下 它 的 内 容 : 


{application, kv, 
[{registered, []}, 
{description, "kv"}, 
{applications, [kernel, stdlib, elixir, logger]}, 
{vsn,"0.0.1"}, 
{modules, ['Elixir.KV', 'Elixir.KV.Bucket', 
"Elixir .KV.Registry', 'Elixir.KV.Supervisor']}]}. 


该 文件 包含 Erlang 的 语句 (使 用 Erlang 的 语法 写 的 ) 。 但 即使 我 们 不 熟悉 Erlang， 也 能 很 容 
多 地 猜 到 这 个 文件 保存 的 是 我 们 应 用 程序 的 定义 。 它 包括 应 用 程序 的 版 本 ， 定 义 的 所 有 模 
块 ， 还 有 它 依赖 的 应 用 程序 列表 ， 如 Erlang 的 Kernel，elixir 本 身 ，logger (我 们 在 mix.exs 里 
添加 的 ) © 


要 是 每 次 我 们 添加 一 个 新 的 模块 就 要 手动 修改 这 个 文件 ， 是 很 讨厌 的 。 这 也 是 为 啥 把 它 交 给 
mix 来 自动 维护 的 原因 。 


我 们 还 可 以 通过 修改 mix.exs LÆ XAP > AA application/o 的 返回 值 ， 来 配置 生成 
的 .app 文件 。 我 们 将 很 快 做 第 一 次 自 定义 配置 。 


5.2.1- 局 动 应 用 程序 


定义 了 .app 文件 (里 面 是 应 MEAE ， 我 们 就 可 以 将 应 用 程序 视 作 一 个 整体 形式 来 局 
动 和 停止 。 到 目前 为 止 我 们 还 没有 考虑 过 这 个 问题 ， 这 是 因为 : 


1，Mix 为 我 们 自动 启动 了 应 用 程序 
2， 即 使 Mix 没 有 自动 启动 我 们 的 程序 ， 该 程序 启动 后 也 没 做 啥 特别 的 事 儿 


总 之 ， 让 我 们 看 看 Mix 如 何 为 我 们 启动 应 用 程序 。 先 在 工程 下 启动 命令 行 ， 然 后 试 着 执行 : 


iex> Application.start(:kv) 
{:error, {:already_started, :kv}} 


擦 ， 已 经 启动 了 ”Mix 通常 动 文件 mix.exs 中 定义 的 整个 应 用 程序 结构 。 遇 到 依赖 的 程序 
也 会 如 此 一 并 局 动 。 


我 们 可 以 给 mix 一 个 选项 ， 证 EKER 动 我 们 的 应 用 程序 。 执行 命 


4: iex -S mix run --no-start 局 亏 2 动 命令 令 行 ， 然 后 执行 : 


iex> Application.start(:kv) 
:Ok 


我 们 可 以 停止 :kv 程序 和 :1logger 程序 ， 后 者 是 Elixir 默 认 情 况 下 自动 启动 的 : 


iex> Application.stop(:kv) 

:Ok 

iex> Application.stop(:logger) 
:Ok 


然后 再 次 启动 我 们 的 程序 : 


iex> Application.start(:kv) 
{:error, {:not_started, :logger}} 


错误 是 由 于 :kv 所 依赖 的 应 用 程序 (这 里 是 :logger ) 没有 启动 导致 的 。 Mix 一 般 会 根据 工 
程 中 的 mix.exs 启动 整个 应 用 程序 结构 ; 对 其 依赖 的 每 个 应 用 程序 来 说 也 是 这 样 (如 果 它 们 
还 依赖 于 其 它 应 用 程序 ) 。 但 是 这 次 我 们 用 了 --no-start 标志 ， 因 此 我 们 需要 手动 按 顺序 
a 办 所 有 应 用 程序 ， 或 者 像 这 样 调 用 Application.ensure_all_started : 


iex> Application.ensure_all_started(:kv) 
{:ok, [:logger, :kv]} 


没什么 激动 人 心 的 ， 这 些 只 是 演示 了 如 何 控制 我 们 的 应 用 程序 。 


当 你 运行 iex -s mix ， 它 相当 于 执行 iex -s mix run ° 因此 无 论 何 时 你 局 动 iex 会 话 ， 
传递 参数 给 mix run ， 实 际 上 是 传递 给 run 命令 。 你 可 以 在 命令 行 中 执 


行 mix help run 获取 关于 run 的 更 多 信息 。 


5.2.2- 应 用 程序 的 回调 (callback ) 

因为 我 们 几乎 都 在 讲 应 用 程序 如 何 启动 和 停止 ， 你 能 猜 到 肯定 有 办 法 能 在 启动 的 当 儿 做 点 有 
意义 的 事情 。 没 错 ， 有 的 1 

我 们 可 以 定义 应 用 程序 的 回调 函数 。 在 应 用 程序 启动 时 ， 该 函数 将 被 调用 。 个 函数 必须 返 
回 {:ok, pid} ， 其 中 pid 是 其 内 部 监督 者 进程 的 标识 符 。 


我 们 分 两 步 来 定义 这 个 回调 函数 。 首 先 ， 打 开 mix.exs 文件 ， 修 改 def application 部 分 : 


def application do 
[applications: [:logger], 
mod: {KV, []}] 

end 


选项 :mod 指出 了 “应 用 程序 回调 函数 的 模块 "， 后面 跟着 该 传递 给 它 的 参数 。 这 个 回调 函数 的 
模块 可 以 是 任意 模块 ， 只 要 它 实现 了 Application 行 为 。 


在 这 里 ， 我 们 要 让 kv 作为 它 回调 函数 的 模块 。 因 此 在 文件 1ib/kv.ex 中 做 一 些 修改 : 


defmodule KV do 
use Application 


def start(_type, _args) do 
KV.Supervisor.start_link 


end 
end 


当 我 们 声明 use Application °> (类 似 声 明了 Genserver ` Supervisor ) 我 们 需要 定义 几 个 
函数 。 这 里 我 们 只 需 定义 start/2 Bo 如果 我 们 想 在 应 用 程序 停止 时 定义 一 个 自 定义 的 行 
为 ， 我 们 也 可 以 定义 一 个 stop/1 BR ° 


现在 我 们 再 次 用 iex -s mix 启动 我 们 的 工程 对 话 。 我们 将 看 到 一 个 名 为 kv.Registry 的 进程 
已 经 在 运行 


iex> KV.Registry.create(KV.Registry, "shopping") 
:Ok 

iex> KV.Registry.lookup(KV.Registry, "shopping") 
{:ok, #PID<0.88.0>} 


好 牛 逼 | 


5.2.3- 工 程 还 是 应 用 程序 


Mix 是 区 分 工程 (projects) 和 应 用 程序 (applications) 的 。 基 于 目前 的 mix.exs ， 我 们 可 以 
说 ， 我 们 有 一 个 Mix 工程 ， 该 工程 定义 了 :kv 应 用 程序 。 在 后 面 章节 我 们 会 看 到 ， 有 些 工程 
一 个 应 用 程序 也 没 定义 。 


ny anes ， eben 它 知道 如 何 去 编 译 、 测 试 你 的 
工程 ， 等 等 。 它 还 知道 如 何 编 译 和 启动 你 的 工程 的 相关 应 用 程序 。 


当 我 们 讲 “ 应 用 程序 "时 ， 我 们 讨论 的 是 OQTP。 应 用 程序 是 一 个 实体 ， 它 作为 一 个 整体 启动 或 者 
停止 。 你 可 以 在 应 用 程序 模块 文档 阅读 更 多 关于 应 用 程序 的 知识 。 或 者 执 
行 mix help compile.app 来 学 习 def application 中 支持 的 更 多 选项 2 


3 简单 的 一 对 一 监督 者 


我 们 已 经 成 功 定 义 了 我 们 的 监督 者 ， 它 作为 我 们 应 用 程序 生命 周期 的 一 部 分 自动 启动 (和 停 
止 ) 。 


回顾 一 下 ， 我 们 的 Kv.Registry 在 handle_cast/2 回调 中 ， 链 接 并 且 监 视 bucket 进 程 


{:ok, pid} = KV.Bucket.start_link() 
ref = Process.monitor(pid) 


链接 是 双向 的 ， 意 味 着 一 个 bucket 进 程 挂 了 会 导致 注册 表 进 程 挂 掉 。 尽管 现在 我 们 有 了 监督 
者 ， 它 能 保证 一 旦 注册 表 进 程 挂 了 还 可 以 重启 。 但 是 注册 表 挂 掉 仍 然 意 味 着 我 们 会 丢失 用 来 
匹配 bucket 名 称 到 其 相应 进程 的 数据 。 


换 句 话说 ， 我 们 希望 即使 Ducket 进 程 挂 了 ， 注 册 表 进程 也 能 够 保持 运行 。 写 成 测试 就 是 : 


test "removes bucket on crash", %{registry: registry} do 
KV.Registry.create(registry, "shopping") 
{:ok, bucket} = KV.Registry.lookup(registry, "shopping") 


# Stop the bucket with non-normal reason 
Process.exit(bucket, :shutdown) 


t Wait until the bucket is dead 
ref = Process.monitor(bucket) 


assert_receive {:DOWN, “ref, _, , Q 
assert KV.Registry.lookup(registry, "shopping") == :error 
end 


这 个 测试 很 像 之 前 的 “退出 时 移 除 bucket”"， 只 是 我 们 的 做 法 更 加 残暴 (用 :shutdown 代替 

了 :normal ) ° 不 像 Agent.stop/1 ， Process.exit/2 是 一 个 异步 的 操作 。 因此 我 们 不 能 简 
单 地 在 刚 发 了 退出 信号 之 后 就 执行 查询 Kv.Registry.lookup/2 ， ne 程 还 
没有 结束 (也 就 不 会 造成 系统 问题 ) 。 为 了 解决 这 个 问题 ， ee ea ths 4 
bucket 进 程 ， 然 后 在 确保 其 已 经 结束 时 再 去 查询 注册 表 进 程 ， 避 免 竞 争 状态 。 


因为 bucket 是 链接 注册 表 进 程 的 ， 而 注册 表 进 程 是 链接 着 测试 进程 。 让 bucket 挂 掉 会 导致 测试 
进程 挂 掉 : 


1) test removes bucket on crash (KV.RegistryTest) 
test/kv/registry_test.exs:52 
** (EXIT from #PID<0.94.0>) shutdown 


一 个 可 行 的 解决 方法 是 提供 kv.Bucket.start/o ， 让 它 执行 agent.start/1 ° 在 注册 表 进 程 中 
使 用 这 个 方法 启动 bucket， 从 而 避免 它们 之 间 的 链接 。 但 是 这 不 是 个 好 办 法 ， 因 为 这 样 
bucket 进 程 就 链接 不 到 任何 进程 。 这 意味 着 所 有 bucket 进 程 即使 在 有 人 停止 了 :kv 程序 也 一 
直 活 着 。 不 光 如 此 ， 它 的 进程 会 变 得 不 可 触及 。 而 一 个 不 可 触及 的 进程 是 难以 在 运行 时 内 省 
的 。 


我 们 将 定义 一 个 新 的 监督 者 来 解决 这 个 问题 。 这 个 新 监督 者 会 派生 和 监督 所 有 的 bucket。 有 
一 个 简单 的 一 对 一 监督 策略 ， 叫 做 :Simple_one_for_one ， 对 于 此 情况 是 非常 适用 的 : 他 允许 
指定 一 个 工人 模板 ， 而 后 监督 基于 那个 模板 创建 的 多 个 孩子 。 在 这 个 策略 下 ， 工 人 进程 不 会 
在 监督 者 初始 化 时 启动 。 而 是 每 次 调用 了 start_child/2 函数 后 ， 才 会 创建 一 个 新 的 工人 进 
程 。 


让 我 们 在 文件 lib/kv/bucket/supervisor.ex 中 定义 KV.Bucket .Supervisor 


defmodule KV.Bucket.Supervisor do 
use Supervisor 


# A simple module attribute that stores the supervisor name 
@name KV.Bucket.Supervisor 


def start_link() do 
Supervisor.start_link(__MODULE__, :ok, name: @name) 
end 


def start_bucket do 
Supervisor.start_child(@name, []) 
end 


def init(:ok) do 


children = [ 
worker(KV.Bucket, [], restart: :temporary) 
] 
supervise(children, strategy: :simple_one_for_one) 
end 


end 


比 起 我 们 第 一 个 监督 者 ， 这 个 监督 者 有 三 点 改变 。 


相 较 于 之 前 接受 所 注册 进程 的 名 字 作 为 参数 ， 我 们 这 里 只 简单 地 将 其 命名 
A kv.Bucket.Supervisor (代码 中 用 MopULE ) ， 因 为 我 们 不 需要 派生 这 个 进程 的 多 个 版 
本 。 


我 们 还 定义 了 有 函数 start_bucket/o 来 启动 每 个 bucket， 作 为 这 个 名 
为 kv.Bucket.sSupervisor 的 监督 者 的 孩子 。 函数 start_bucket/o 代替 了 注册 表 进 程 中 直接 调 


用 的 KV.Bucket.start_link ° 


最 后 ， 在 init/1 回调 中 ， 我 们 将 工人 进程 标记 为 temporary 。 意思 是 如 果 bucket 进 程 即 使 
挂 了 也 不 回 重启 。 因 为 我 们 创建 这 个 监督 者 ， 只 是 用 来 作为 将 bucket 进 程 圈 成 组 这 么 一 种 机 
制 。 bucket 进 程 的 创建 还 应 该 通过 注册 表 进 程 。 


执行 iex -s mix 来 试用 下 这 个 新 监督 者 : 


iex> {:ok, _} = KV.Bucket.Supervisor.start_link 

{:ok, #PID<0.70.0>} 

iex> {:ok, bucket} = KV.Bucket.Supervisor.start_bucket() 
{:ok, #PID<0.72.0>} 

iex> KV.Bucket.put(bucket, "eggs", 3) 

:OK 

iex> KV.Bucket.get(bucket, "eggs") 

3 


修改 注册 表 进 程 中 启动 bucket 的 部 分 ， 来 与 bucket 的 监督 者 协同 工作 : 


def handle_cast({:create, name}, {names, refs}) do 
if Map.has_key?(names, name) do 
{:noreply, {names, refs}} 
else 
{:ok, pid} = KV.Bucket.Supervisor.start_bucket() 
ref = Process.monitor(pid) 
refs = Map.put(refs, ref, name) 
names = Map.put(names, name, pid) 
{:noreply, {names, refs}} 
end 
end 


在 做 了 这 些 修改 之 后 ， 我 们 的 测试 还 是 会 fail。 因 为 bucket 的 监督 者 还 没有 启动 。 但 是 我 们 将 
不 会 在 每 次 测试 启动 时 启动 bucket 的 监督 者 ， 而 是 让 其 作为 我 们 主 监督 者 树 的 一 部 分 自动 局 
动 。 


为 了 在 应 用 程序 中 使 用 bucket 的 监督 者 ， 我 们 要 把 它 作为 一 个 孩子 加 到 kv.supervisor 中 去 。 
注意 ， 我 们 已 经 开始 用 一 个 监督 者 去 监督 另 一 个 监督 者 了 --- 正 式 的 称呼 是 “监督 树 ”。 


打开 1ib/kv/supervisor.ex ， 添 加 一 个 新 的 模块 属性 存储 bucket 监 督 者 的 名 字 ， 并 且 修 
改 init/1 


def init(:ok) do 

children = [ 
worker(KV.Registry, [KV.Registry]), 
supervisor(KV.Bucket.Supervisor, []) 


] 


supervise(children, strategy: :one_for_one) 
end 


这 里 我 们 添加 了 一 个 监督 者 作为 孩子 (没有 传递 启动 参数 ) 。 重 新 运行 测试 ， 测 试 将 可 以 通 
过 o 


记 住 ， 声 明 各 个 孩子 的 顺序 是 很 重要 的 。 因 为 注册 表 进 程 依赖 于 bucket 监 督 者 ， 所 以 bucket 
监督 者 需要 在 孩子 列表 中 排 得 靠 前 一 些 。 


因为 我 们 已 为 监督 者 添加 了 多 个 孩子 ， 现 在 就 需要 考虑 使 用 :one_for_one 这 个 策略 还 是 否 正 
确 。 一 个 显现 的 问题 就 是 注册 表 进 程 和 bucket 监 督 者 之 间 的 关系 。 如 果 注 册 表 进程 挂 了 ， 
bucket 监 督 者 也 必须 挂 。 因 为 一 旦 注册 表 进 程 挂 了 ， 所 有 关联 bucket 名 字 和 其 进程 的 信息 也 
就 丢失 了 。 此 时 若 bucket 的 监督 者 还 活着 ， 它 掌管 的 众多 bucket 将 根本 访问 不 到 ， 变 成 垃 
To 


我 们 可 以 考虑 使 用 其 他 的 策略 ， 如 :one for all 或 :rest_for_one ° 策略 :one for_all 在 任 
何 时 候 ， 只 要 有 一 个 孩子 挂 ， 它 就 会 停止 并 且 重 启 所 有 孩子 进程 。 这 个 貌似 符 — 
求 ， 但 是 有 些 简 单 粗 暴 。 因 为 如 果 bucket 监 督 者 进程 挂 了 ， 是 没 必 要 同时 挂 掉 注 册 表 进 


的 。 因 为 注册 表 进 程 本 身 就 监控 这 每 个 bucket 进 程 的 状态 ， 它 会 自己 清理 不 需要 的 信息 ( 挂 
掉 的 bucket) 。 因 此 ， 策 略 :rest_for_one 是 比较 合适 的 。 它 会 单独 重启 挂 掉 的 孩子 进程 ， 
而 不 影响 其 它 的 。 因 此 我 们 做 如 下 修改 : 


def init(:ok) do 
children = [ 
worker(KV.Registry, [KV.Registry]), 
supervisor(KV.Bucket.Supervisor, []) 


] 


supervise(children, strategy: :rest_for_one) 
end 


如 果 注 册 表 进程 挂 了 ， 那 么 它 和 bucket 监 督 者 都 会 被 重启 ; 而 如 果 只 是 bucket 监 督 者 进程 挂 
了 ， 和 那么 只 有 它 自己 被 重启 。 


还 有 其 它 几 个 策略 或 选项 可 以 传递 给 worker/2 ， supervisor/2 和 supervise/2 函数 ， 所 以 可 
别 忘记 阅读 监督 者 及 监督 者 .spec 的 文档 。 


5.5 观察 者 (Observer ) 


现在 我 们 定义 好 了 监督 者 树 ， 介绍 观察 者 工具 (Observer tool) 的 最 佳 时 机 。 该 工具 和 
Erlang 一 同 推出 。 使 用 iex -s mix 启动 你 的 应 用 程序 ， 输 入 : 


iex> :observer.start 


Annies ， 里 面包 含 了 关于 我 们 系统 的 各 种 信息 : 从 总 体 统计 信息 到 负载 图 表 ， 
还 有 运行 中 的 所 有 进程 和 应 用 程序 。 


在 “应 用 程序 "Tab 页 上 ， 可 以 看 到 系统 中 运行 的 所 有 应 用 程序 以 及 它们 的 监督 者 树 信 息 。 可 以 
选择 kv © 查看 它 的 详细 信息 hone 
eee nonode@nohost 
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不 但 如 此 ， 如 果 你 再 命令 行 中 创建 新 的 bucket : 


iex> KV.Registry.create KV.Registry, "shopping" 
:ok 


你 可 以 在 观察 者 工具 中 看 到 从 监督 者 树种 派生 出 了 新 的 进程 。 


be 


网 察 者 工具 就 留 给 读者 自行 探索 。 o 你 可 以 双击 进程 查 看 其 详细 信 息 ， 还 可 以 右 击 发 送 停止 信 
号 (模拟 进程 失败 的 完美 方法 ) 等 等 。 


在 每 天 辛苦 工作 快要 结束 的 时 候 ， 一 个 像 观 察 者 这 样 的 工具 绝对 是 你 还 想 着 在 监督 者 树 里 创 
建 几 条 进程 的 主要 原因 之 一 。 即使 创建 的 都 是 临时 的 ， 你 也 可 以 看 看 整个 工程 里 各 个 进程 还 
是 不 是 可 触及 或 是 可 内 省 的 。 


5.6 测试 里 共享 的 状态 
目前 为 止 ， 我 们 是 在 每 个 测试 中 启动 一 个 注册 表 进 程 ， 以 确保 它们 是 独立 的 : 


setup context do 
{:ok, registry} = KV.Registry.start_link(context.test) 
{:ok, registry: registry} 

end 


因为 我 们 已 经 将 注册 表 进 程 改 成 使 用 Kv. Bucket.Supervisor 了 ， 而 它 是 在 全 局 注册 的 ， 因 此 
现在 我 们 的 测试 依赖 于 这 个 共享 的 、 全 局 的 监督 者 ， 即 使 每 个 测试 仍 使 用 自己 的 注册 表 进 
程 。 那 么 问题 来 了 : 我 们 是 否 应 该 这 么 做 ? 


lt depends。 只 要 仅 依 赖 于 某 一 状态 的 非 共 享 部 分 ， 那 么 也 还 OKk 啦 。 比 如 ， 每 次 用 一 个 名 字 注 
册 进 程 ， 都 是 注册 在 一 个 共享 的 注册 表 中 。 pie ， 只 要 确保 每 个 名 字 用 于 不 同 的 测试 ， 
比如 在 创建 时 使 用 上 下 文 参数 context.test ， 就 不 会 再 测试 间 出 现 并 行 或 者 数据 依赖 的 问 


题 。 


对 我 们 的 bucket 监 督 者 来 说 也 是 同样 的 道理 。 尽 管 多 个 注册 表 进 程 会 在 共享 的 bucket 监 督 者 上 

启动 bucket ， 但 这 些 bucket 和 注册 表 进 2 ae. o 我们 唯一 会 遇 到 并 发 问题 ， 是 
我 们 想 要 调用 hy Be Supervisor .count_children(kKV.Bucket. en 的 时 候 -o EY 统计 所 有 注 
册 表 进程 下 的 所 有 bucket。 当 测试 并 行 执行 并 调用 它 的 时 候 ， 返 回 的 结果 可 能 不 一 样 。 


因此 ， 目 前 由 于 我 们 的 测试 依赖 于 共享 的 监督 者 中 的 非 共享 部 分 ， 我 们 不 用 担心 并 发 问题 。 
假如 它 成 为 问题 了 ， 我 们 可 以 给 每 个 测试 启动 一 个 监督 者 ， 并 将 其 作为 参数 传递 给 注册 表 进 
程 的 start_link BR ax © 


至 此 ， 我 们 的 应 用 程序 已 经 被 监督 者 监督 着 ， 而 且 也 已 测试 通过 。 之 后 我 们 要 想 办 法 提升 一 
些 性 能 。 


6-ETS 


ETS 当 缓存 用 
竞争 条 件 ? 
ETS 当 持久 存储 用 


每 次 我 们 要 找 一 个 bucket 时 ， 都 要 发 消息 给 注册 表 进 在 某 些 情况 下 ， 这 意味 着 注册 表 进 
程 会 变 成 性 能 瓶颈 | 


本 章 我 们 将 学 习 ETS (Erlang Term Storage) ， 以 及 如 何 把 它 当 成 缓存 使 用 。 之 后 我 们 会 拓 
展 它 的 功能 ， 把 数据 从 监督 者 保存 到 其 孩子 上 。 这 样 即使 月 溃 ， 数 据 也 能 存续 。 


严重 注意 ! 绝对 不 要 冒失 地 把 ETS 当 缓存 用 。 和 仔细 分 析 你 的 程序 ， 看 看 到 底 哪里 才 是 瓶 
颈 。 这 样 来 决定 是 否 需要 缓存 以 及 缓存 什么 。 本 章 仅 仅 讲解 ETS 是 如 何 工作 的 一 个 例 


子 ， 具 体 怎么 做 得 由 你 自己 决定 。 
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ETS 可 以 把 Erlang/Elixir 的 词语 (term) 存储 在 内 存 表 中 。 使 用 Erlang 的 :ets 模块 来 操作 : 


iex> table = :ets.new(:buckets_registry, [:set, :protected]) 
8207 
iex> :ets.insert(table, {"foo", self}) 


Ue 
iex> :ets.lookup(table, "foo") 
[{"foo", #PID<0.41.0>}] 


创建 一 个 ETS 表 时 ， 需 要 两 个 参数 : 表 名 和 一 组 选项 。 对 于 在 上 面 的 例子 ， 在 可 选 的 选 
ee 。 我们 选择 了 ;set 类 型 ， 意 思 是 键 不 能 有 重复 (集合 
论 ) 。 eee ae protected ， 意 思 是 对 于 这 个 表 ， 只 有 创建 该 表 的 进程 可 以 修 
改 ， 而 其 它 进程 只 能 读 取 。 这 两 个 选项 是 默认 的 ， 这 里 就 不 多 说 了 。 


ETS 表 可 以 被 命名 ， 可 以 通过 名 字 访 问 : 


iex> :ets.new(:buckets_registry, [:named_table] ) 
:buckets_registry 

iex> :ets.insert(:buckets_registry, {"foo", self}) 
true 

iex> :ets.lookup(:buckets_registry, "foo") 
[{"foo", #PID<0.41.0>}] 


好 了 ， 现 在 我 们 使 用 ETS 表 ， 修 改 kv.Registry 。 我 们 对 事件 管理 器 和 bucket 的 监督 者 使 用 
相同 的 技术 ， 显 式 传递 ETS 表 名 给 start_link 。 记 住 ， 有 了 服务 器 以 及 ETS 表 的 名 字 ， 本 地 
进程 就 可 以 访问 那个 表 。 


打开 lib/kv/registry.ex ， 修 改 里 面 的 实现 。 加 上 注释 来 标明 我 们 的 修改 : 


defmodule KV.Registry do 
use GenServer 


## Client API 


@doc nun 
Stants the registry: 
def start_link(table, event_manager, buckets, opts \\ []) do 
# 1. We now expect the table as argument and pass it to the server 





GenServer.start_link( MODULE , {table, event_manager, buckets}, opts) 


end 


@doc nun 
Looks up the bucket pid for name stored in table. 


Returns {vok pid} if a bucket exists, error otherwise. 
def lookup(table, name) do 
# 2. lookup now expects a table and looks directly into ETS. 
# No request is sent to the server. 
case :ets.lookup(table, name) do 
[{Aname, bucket}] -> {:ok, bucket} 
[] -> :error 
end 
end 


@doc nun 


Ensures there is a bucket associated with the given name in ‘server’. 


Win 


def create(server, name) do 
GenServer.cast(server, {:create, name}) 
end 


## Server callbacks 


def init({table, events, buckets}) do 
# 3. We have replaced the names HashDict by the ETS table 
ets = :ets.new(table, [:named_table, read_concurrency: true]) 
refs = HashDict.new 
{:ok, %{names: ets, refs: refs, events: events, buckets: buckets}} 
end 


# 4. The previous handle_call callback for lookup was removed 


def handle_cast({:create, name}, state) do 
# 5. Read and write to the ETS table instead of the HashDict 
case lookup(state.names, name) do 
{:0k, _pid} -> 
{:noreply, state} 
:error -> 
{:ok, pid} = KV.Bucket.Supervisor.start_bucket(state.buckets) 
ref = Process.monitor(pid) 
refs = HashDict.put(state.refs, ref, name) 
:ets.insert(state.names, {name, pid}) 
GenEvent.sync_notify(state.events, {:create, name, pid}) 
{:noreply, %{state | refs: refs}} 
end 
end 


def handle_info({:DOWN, ref, :process, pid, _reason}, state) do 
# 6. Delete from the ETS table instead of the HashDict 
{name, refs} = HashDict.pop(state.refs, ref) 
:ets.delete(state.names, name) 
GenEvent.sync_notify(state.events, {:exit, name, pid}) 
{:noreply, %{state | refs: refs}} 

end 


N 


def handle_info(_msg, state) do 
{:noreply, state} 
end 
end 


注意 ， 修 改 前 的 Kv.Registry.lookup/2 给 服务 器 发 送 请 求 ; 修改 后 ， 它 就 直接 从 ETS 表 里 面 读 
取 数 据 了 。 该 表 是 对 各 进程 都 共享 的 。 这 就 是 我 们 实现 的 缓存 机 制 的 大 体 想 法 。 


为 了 让 缓存 机 制 工作 ， 新 建 的 ETS 起 码 需 要 protected 访问 规则 (默认 的 ) ， 这 样 客 户 端 才 
能 从 中 读 取 数据 。 否则 就 只 有 kv registry 进程 才能 访问 。 我 们 还 在 局 动 ETS 表 时 设置 
了 :read_concurrency ” 为 表 的 并 发 访 问 稍 作 优化 2 


我 们 以 上 的 改动 导致 测试 都 挂 了 。 一 个 重要 原因 是 我 们 在 启动 注册 表 进 程 时 ， 需 要 多 传递 一 
个 参数 给 KV.Registry.start_link/3 ° 让 我 们 重 写 setup 回调 来 修复 测试 代 


码 test/kv/registry_test.exs 


setup do 
{:ok, sup} = KV.Bucket.Supervisor.start_link 
{:ok, manager} = GenEvent.start_link 
{:ok, registry} = KV.Registry.start_link(:registry_table, manager, sup) 


GenEvent.add_mon_handler(manager, Forwarder, self()) 
{:ok, registry: registry, ets: :registry_table} 
end 


注意 我 们 传递 了 一 个 表 名 :registry_table 给 Kv.Registry.start_link/3 ， 其 后 返回 
了 ets: :registry_table ， 成 为 了 测试 的 上 下 文 。 


修改 了 这 个 回调 后 ， 测 试 仍 有 fail， 差 不 多 都 是 这 个 样子 : 


1) test spawns buckets (KV.RegistryTest) 
test/kv/registry_test.exs:38 
** (ArgumentError) argument error 
stacktrace: 
(stdlib) :ets.lookup(#PID<0.99.0>, "shopping" ) 
(kv) lib/kv/registry.ex:22: KV.Registry.lookup/2 
test/kv/registry_test.exs:39 


这 是 因为 我 们 传递 了 注册 表 进 程 的 pid 给 函数 Kv.Registry.lookup/2 ， 而 它 期 待 的 却 是 ETS 的 
表 名 。 为 了 修复 我 们 要 把 所 有 的 : 


KV.Registry.lookup(registry, ...) 
都 改 为 : 
KV.Registry.lookup(ets, ...) 


其 中 获取 ets 的 方法 跟 我 们 获取 注册 表 一 个 样子 : 


test "spawns buckets", %{registry: registry, ets: ets} do 


像 这 样 ， 我 们 对 测试 进行 修改 ， 把 ets 传递 给 lookup/2 。 一 旦 我 们 完成 这 
还 是 会 失败 。 你 还 会 观察 到 ， 每 次 执行 测试 ， 成 功 和 失败 不 是 稳定 的 。 例 如 
bucket 进 程 > 这 个 测试 来 说 : 


test "Spawns buckets", %{registry: registry, ets: ets} do 
assert KV.Registry.lookup(ets, "shopping") == :error 


KV.Registry.create(registry, "shopping" ) 
assert {:ok, bucket} = KV.Registry.lookup(ets, "shopping") 


KV.Bucket.put(bucket, "milk", 1) 
assert KV.Bucket.get(bucket, "milk") == 1 
end 


assert {:ok, bucket} = KV.Registry.lookup(ets, "shopping" ) 


但 是 假如 我 们 在 这 行 创建 一 个 bucket， 还 会 失败 吗 ? 
RAAT ( 嗯 哼 ! 基于 教学 目的 ) ， 我 们 犯 了 两 个 错误 : 


1. 我们 过 于 冒进 地 使 用 缓存 来 优化 
2， 我 们 使 用 的 是 cast/2 ， 它 应 该 是 call/2 


6.2-% # A? 


些 修 改 ， 有 些 测 试 
， 对 于 "派生 


用 Elixir 编 程 不 会 让 你 避免 竞争 状态 。 但 是 Elixir 关 于 “ 没 啥 是 共享 "的 这 个 特点 可 以 帮助 你 很 容 


易 找 到 导致 竞争 状态 的 根本 原因 。 


我 们 测试 中 发 生 的 事 儿 是 延迟 --- 介 于 我 们 操作 和 我 们 观察 到 ETS 表 被 改动 之 间 。 下 面 是 我 们 


期 望 发 生 的 : 


我 们 执行 Kv. Registry.create(registry, "shopping") 

注册 表 进 程 创 建 了 bucket， 并 且 更 新 了 缓存 表 

我 们 用 KV.Registry.lookup(ets, "shopping") 从 表 中 获取 信息 
上 面 的 命令 返回 {:ok，bucket} 


a O N > 


但 是 ， 因 为 kv.Registry.create/2 1% M casti íF > PAE AEGA AAR 
话说 ， 其 实 发 生 了 下 面 的 事 : 


1. 我 们 执行 KV.Registry.create(registry, "shopping" ) 
2， 我 们 用 kv.Registry.lookup(ets, "shopping") 从 表 中 获取 信息 
3. 命令 返回 :error 


了 结果 ! He] 


4. 注册 表 进 程 创建 了 bucket， 并 且 更 新 了 缓存 表 


要 修复 这 个 问题 AN 只 需要 让 KV.Registry.create/2 同步 操作 ， 使 用 call/2 而 不 是 cast/2 ° 
这 就 能 保证 客户 端 只 会 在 表 被 修改 后 才能 继续 下 面 的 操作 。 让 我 们 来 修改 相应 函数 和 回调 : 


def create(server, name) do 
GenServer.call(server, {:create, name}) 
end 


def handle_call({:create, name}, _from, state) do 
case lookup(state.names, name) do 
{:ok, pid} -> 
{:reply, pid, state} # Reply with pid 
:error -> 
{:ok, pid} = KV.Bucket.Supervisor.start_bucket(state.buckets) 
ref = Process.monitor(pid) 
refs = HashDict.put(state.refs, ref, name) 
:ets.insert(state.names, {name, pid}) 
GenEvent.sync_notify(state.events, {:create, name, pid}) 
{:reply, pid, %{state | refs: refs}} # Reply with pid 
end 
end 


我 们 只 是 简单 地 把 回调 里 的 handle cast/2 改 成 了 handle_call/3 ， 并 且 返 回 创建 的 bucket 的 
pid ° 


现在 执行 下 测试 。 这 次 ， 我 们 要 使 用 --trace 选项 : 


$ mix test --trace 


如 果 你 的 测试 中 有 死 锁 或 者 竞争 条 件 时 ， --trace 选项 非常 有 用 。 因 为 它 可 以 同步 执 和 
测试 (而 async: true 没 哈 效果 ) ， 并且 显 式 每 条 测试 的 详细 信息 。 这 次 我 们 应 该 只 有 一 
败 〈 可 能 也 是 间 歌 性 的 ) 


1) test removes buckets on exit (KV.RegistryTest) 
test/kv/registry_test.exs:48 
Assertion with == failed 
code: KV.Registry.lookup(ets, "Shopping") == :error 
lhs: {:ok, #PID<0.103.0>} 
rhs: :error 
stacktrace: 
test/kv/registry_test.exs:52 


根据 错误 信息 ， 我 们 期 望 表 中 没有 bucket， 但 是 它 却 有 。 这 个 问题 和 我 们 刚刚 解决 的 相反 : 
之 前 的 问题 是 创建 bucket 的 命令 与 更 新 表 之 间 的 延迟 ， 而 现在 是 bucket 处 理 退 出 操作 与 清除 它 
在 表 中 的 记录 之 间 的 延迟 。 


不 幸 的 是 ， 这 次 我 们 无 法 简单 地 把 handle_info/2 改 成 一 个 同步 的 操作 。 但 是 我 们 可 以 用 事件 
管理 器 的 通知 来 修复 该 失败 。 先 来 看 看 我 们 handle_info/2 的 实现 : 


def handle_info({:DOWN, ref, :process, pid, _reason}, state) do 
# 5. Delete from the ETS table instead of the HashDict 
{name, refs} = HashDict.pop(state.refs, ref) 
:ets.delete(state.names, name) 
GenEvent.sync_notify(state.event, {:exit, name, pid}) 
{:noreply, %{state | refs: refs}} 

end 


注意 我 们 在 发 通知 之 前 就 从 ETS 表 中 进行 删除 操作 。 这 是 有 意 为 之 的 。 这 意味 着 当 我 们 收 
到 f:exit, name, pid} 通知 的 时 候 ， 表 即 已 经 是 最 新 了 。 让 我 们 更 新 剩 下 的 代码 : 


test "removes buckets on exit", %{registry: registry, ets: ets} do 
KV.Registry.create(registry, "shopping") 
{:ok, bucket} = KV.Registry.lookup(ets, "shopping") 
Agent.stop(bucket ) 
assert_receive {:exit, "shopping", bucket} # Wait for event 
assert KV.Registry.lookup(ets, "shopping") == :error 

end 


我 们 对 测试 稍 作 调整 ， 保 证 先 收 到 fi:exit，name，pid]} 消 息 ， 再 执行 KV.Registry.lookup/2… ° 


你 看 ， 我 们 能 够 通过 修改 程序 逻辑 来 使 测试 通过 ， 而 不 是 使 用 诸如 :timer.sleep/1 或 者 其 它 
小 技巧 。 这 很 重要 。 大 部 分 时 间 里 ， 我 们 依赖 于 事件 ， 监 视 以 及 消息 机 制 来 确保 系统 处 在 期 
望 状态 ， 在 执行 测试 断言 之 前 。 


为 方便 ， 下 面 给 出 能 通过 的 测试 全 文 : 


defmodule KV.RegistryTest do 
use ExUnit.Case, async: true 


defmodule Forwarder do 
use GenEvent 


def handle_event(event, parent) do 
send parent, event 
{:ok, parent} 
end 
end 


setup do 
{:ok, sup} = KV.Bucket.Supervisor.start_link 
{:ok, manager} = GenEvent.start_link 
{:ok, registry} = KV.Registry.start_link(:registry_table, manager, sup) 


GenEvent.add_mon_handler(manager, Forwarder, self()) 
{:ok, registry: registry, ets: :registry_table} 
end 


test "sends events on create and crash", %{registry: registry, ets: ets} do 
KV.Registry.create(registry, "shopping") 
{:ok, bucket} = KV.Registry.lookup(ets, "shopping") 
assert_receive {:create, "shopping", bucket} 


Agent.stop(bucket ) 
assert_receive {:exit, "shopping", bucket} 
end 


test "spawns buckets", %{registry: registry, ets: ets} do 
assert KV.Registry.lookup(ets, "shopping") == :error 


KV.Registry.create(registry, "shopping") 
assert {:ok, bucket} = KV.Registry.lookup(ets, "shopping") 


KV.Bucket.put(bucket, "milk", 1) 
assert KV.Bucket.get(bucket, "milk") == 1 
end 


test "removes buckets on exit", %{registry: registry, ets: ets} do 
KV.Registry.create(registry, "shopping") 
{:ok, bucket} = KV.Registry.lookup(ets, "shopping") 
Agent.stop(bucket ) 
assert_receive {:exit, "shopping", bucket} # Wait for event 
assert KV.Registry.lookup(ets, "shopping") == :error 

end 


test "removes bucket on crash", %{registry: registry, ets: ets} do 
KV.Registry.create(registry, "shopping") 
{:ok, bucket} = KV.Registry.lookup(ets, "shopping") 


# Kill the bucket and wait for the notification 
Process.exit(bucket, :shutdown) 
assert_receive {:exit, "shopping", bucket} 
assert KV.Registry.lookup(ets, "shopping") == :error 
end 
end 


随 着 测试 通过 ， 我 们 只 需 更 新 监督 者 init/1 回调 函数 的 代码 (X 
件 lib/kv/supervisor.ex ) ， 传 递 ETS 表 的 名 字 作为 参数 给 注册 表 工 人 : 


@manager_name KV.EventManager 
@registry_name KV.Registry 
@ets_registry_name KV.Registry 
@bucket_sup_name KV.Bucket.Supervisor 


def init(:ok) do 
children = [ 
worker(GenEvent, [[name: @manager_name]]), 
supervisor(KV.Bucket.Supervisor, [[name: @bucket_sup_name]]), 
worker(KV.Registry, [@ets_registry_name, @manager_name, 
@bucket_sup_name, [name: @registry_name]]) 
] 


supervise(children, strategy: :one_for_one) 
end 


注意 我 们 仍 使 用 kv.Registry 作为 ETS 表 的 名 字 ， 好 让 debug 方 便 些 ， 因 为 它 指明 了 使 用 它 的 
模块 。ETS 名 和 进程 名 分 别 存储 在 不 同 的 注册 表 ， 以 避免 冲突 。 


6.3-ETS 当 持久 存储 用 


到 目前 为 止 ， 我 们 在 初始 化 注册 表 的 时 候 创建 了 一 个 ETS 表 ， 而 没有 操心 在 注册 表 结 来 时 关 
闭 该 ETS 表 。 这 是 因为 ETS 表 是 “连接 ”( 某 种 修 僚 上 说 ) 着 创建 它 的 进程 的 。 如 果 那 进程 挂 
了 ， 表 也 会 自动 关闭 。 


这 作为 默认 行为 实在 是 太 方便 了 ， 我 们 可 以 在 将 来 更 多 地 利用 这 个 特点 。 记 住 ， 注 册 表 和 

bucket 监 督 者 之 间 有 依赖 。 注 册 表 挂 ， 我 们 希望 bucket 监 督 者 也 挂 。 因为 一 旦 注册 表 挂 ， 所 

有 连接 bucket 进 程 的 信息 都 会 丢失 。 但 是 ， 假 如 我 们 能 保存 注册 表 的 数据 怎么 样 ? 如 果 我 们 

能 做 到 这 点 ， 就 可 以 去 除 注 册 表 和 bucket 监 督 者 之 间 的 依赖 了 ， 让 :one_for_one 成 为 监督 者 
合适 的 策略 。 


要 做 到 这 点 需要 些小 改动 。 首 先 我 们 需要 在 监督 者 内 启动 ETS 表 。 其 次 ， 我 们 需要 把 表 的 访 
问 类 型 从 :protected KA :public ° 因为 表 的 所 有 者 是 监督 者 ， 但 是 进行 修改 操作 的 仍然 是 
时 间 管 理 者 。 


让 我 们 从 修改 kv.supervisor 的 init/1 回调 开始 : 


def init(:ok) do 
ets = :ets.new(@ets_registry_name, 
[:set, :public, :named_table, {:read_concurrency, true}]) 


children = [ 
worker(GenEvent, [[name: @manager_name]]), 
supervisor(KV.Bucket.Supervisor, [[name: @bucket_sup_name]]), 
worker(KV.Registry, [ets, @manager_name, 
@bucket_sup_name, [name: @registry_name]]) 
] 


supervise(children, strategy: :one_for_one) 
end 


接 下 来 ， 我 们 修改 kv registry 的 init/1 回调 ， 因 为 它 不 再 需要 创建 一 个 表 ， 而 是 需要 一 个 
表 作为 参数 : 


def init({table, events, buckets}) do 

refs = HashDict.new 

{:ok, %{names: table, refs: refs, events: events, buckets: buckets}} 
end 


最 终 ， 我 们 修改 test/kv/registry_test.exs 中 的 setup 回调 ， 来 显 式 地 创建 ETS 表 。 我 们 还 
将 用 这 个 机 会 分 离 setup 的 功能 ， 放 到 一 个 方便 的 私有 函数 中 : 


Setup do 
ets = :ets.new(:registry_table, [:set, :public]) 
registry = start_registry(ets) 
{:ok, registry: registry, ets: ets} 

end 


defp start_registry(ets) do 
{:ok, sup} = KV.Bucket.Supervisor.start_link 
{:ok, manager} = GenEvent.start_link 
{:ok, registry} = KV.Registry.start_link(ets, manager, sup) 


GenEvent.add_mon_handler(manager, Forwarder, self()) 


registry 
end 


这 之 后 ， 我 们 的 测试 应 该 都 绿 啦 ! 


现在 只 剩 下 一 个 场景 需要 考虑 : 一 旦 我 们 收 到 了 ETS 表 ， 可 能 有 现存 的 bucket 的 pid 在 这 个 表 
Po 这 是 我 们 这 次 改动 的 目的 。 但 是 ， 新 启动 的 注册 表 进 程 没有 监视 这 些 bucket， 因 为 它们 
是 作为 之 前 的 注册 表 的 一 部 分 创建 的 ， 现 在 那些 注册 表 已 经 不 存在 了 。 这 意味 着 表 将 被 严重 
拖累 ， 因 为 我 们 都 不 去 清除 已 经 挂 掉 的 bucket 。 


来 增加 一 个 测试 来 暴露 这 个 bug : 


test "monitors existing entries", %{registry: registry, ets: ets} do 
bucket = KV.Registry.create(registry, "shopping") 


# Kill the registry. We unlink first, otherwise it will kill the test 
Process.unlink(registry) 
Process.exit(registry, :shutdown) 


# Start a new registry with the existing table and access the bucket 
start_registry(ets) 
assert KV.Registry.lookup(ets, "“shopping") == {:o0k, bucket} 


# Once the bucket dies, we should receive notifications 

Process.exit(bucket, :shutdown) 

assert_receive {:exit, "shopping", bucket} 

assert KV.Registry.lookup(ets, "shopping") == :error 
end 


执行 这 个 测试 ， 它 将 失败 : 


1) test monitors existing entries (KV.RegistryTest) 
test/kv/registry_test.exs:72 
No message matching {:exit, "shopping", Abucket} 
stacktrace: 
test/kv/registry_test.exs:85 


这 是 我 们 期 望 的 。 如 果 bucket 不 被 监视 ， 在 它 挂 的 时 候 ， 注 册 表 将 得 不 到 通知 ， 因 此 也 没有 
事件 发 生 。 我 们 可 以 修改 kv.Registry 的 init/1 回调 来 修复 这 个 问题 。 给 所 有 表 中 的 现存 条 
目 设 置 监视 器 


def init({table, events, buckets}) do 
refs = :ets.foldl(fn {name, pid}, acc -> 
HashDict.put(acc, Process.monitor(pid), name) 
end, HashDict.new, table) 


{:ok, %{names: table, refs: refs, events: events, buckets: buckets}} 
end 


我 们 用 :ets.foldl/3 来 遍历 表 中 所 有 条 目 ， 类 似 于 Enum.reduce/3 。 它 为 每 个 条 目 执行 提供 
的 函数 ， 并 且 用 一 个 累加 器 累加 结果 。 在 函数 回调 中 ， 我 们 oe tea 并 相应 地 更 
新 存放 引用 信息 的 字典 。 如 果 有 某 个 条 目 是 挂 掉 的 ， 我 们 还 能 收 到 :DowN 消息 ， 稍 后 可 以 清 


REN ° 


本 章 让 监督 者 拥有 ETS 表 ， 并 且 使 其 将 表 作为 参数 传递 给 注册 表 进 程 。 通 过 这 样 的 方法 ， 
们 让 程序 变 得 更 加 健壮 。 我 们 还 探索 了 把 ETS 当 作 缓 存 ， 并 且 讨 论 了 如 果 在 客户 端 和 服务 器 
共享 数据 时 会 进入 的 竞争 状态 。 


7- 依 赖 和 伞 工 程 


外 部 依赖 

内 部 依赖 

伞 工 程 

在 伞 依赖 之 中 

总 结 

本 章 我 们 简短 地 讨论 在 Mix 中 如 何 管理 依赖 。 

我 们 的 应 用 程序 kv 完成 了 ， 现 在 是 时 候 实现 我 们 第 一 章 提 到 的 那个 处 理 请 求 的 服务 器 了 : 
CREATE shopping 
OK 


PUT shopping milk 1 
OK 


PUT shopping eggs 3 
OK 


GET shopping milk 
1 
OK 


DELETE shopping eggs 
OK 


我 们 不 会 再 往 kv 应 用 程序 中 添加 代码 ， 而 是 来 创建 一 个 TCP 服 务 器 作为 kv HEP He AA 
整个 Elixir 生 态 系统 被 设 定 为 更 加 适应 应 用 程序 。 因 此 我 们 最 好 是 把 工程 分 成 小 的 应 用 程序 ， 
而 不 是 大 一 统 。 


在 创建 新 的 应 用 程序 之 前 ， 我 们 必须 先 来 讨论 Mix 如 何 处 理 依赖 。 实际 中 ， 我 们 会 遇 到 两 种 依 
Hl : 内 部 的 和 外 部 的 。Mix 都 支持 。 


7.1- 外 部 依赖 


外 部 的 依赖 不 是 你 整 的 。 上 比如， 你 要 发 布 的 KV 程序 ， 它 需要 HTTP 的 APl， 你 可 以 用 Plug 作 为 
一 个 外 部 依赖 。 


安装 外 部 依赖 很 简单 。 通 常 我 们 使 用 Hex 包 管理 器 。 你 只 要 在 mix.exs 中 的 deps 函 数 中 列 出 
依赖 : 
def deps do 


[{:plug, "~> 0.5.0"}] 
end 


这 个 依赖 引用 的 是 plug 在 0.5.x 系 列 版 本 中 最 新 推送 给 Hex 的 一 个 。 -> 后 面 跟着 版 本 数字 。 更 
多 关于 如 何 指定 某 特定 版 本 的 信息 ， 请 参考 Version 模 块 文档 。 


通常 推 给 Hex 的 都 是 稳定 的 发 行 版 。 如 果 你 想 依赖 的 是 正在 开发 中 的 最 新 版 本 ， 那 么 Mix 还 支 
持 你 引用 git 中 的 相应 repo : 


def deps do 
[{:plug, git: "git://github.com/elixir-lang/plug.git"}] 
end 


你 会 注意 到 ， 当 你 给 你 的 工程 加 了 一 个 依赖 后 ，Mix 会 生成 了 一 个 mix.lock 文件 ， 用 该 文件 
确保 可 重复 的 构建 。lock 文 件 必 须 ckeckin 到 你 的 版 本 管理 系统 中 去 ， 来 保证 任何 使 用 这 个 工 
程 的 人 都 拥有 和 你 同样 的 依赖 的 版 本 。 


Mix 提 供 了 很 多 依赖 相关 的 操作 ， 可 以 用 mix help 查看 : 


$ mix help 

mix deps 

mix deps.clean 
mix deps.compile 
mix deps.get 

mix deps.unlock 
mix deps.update 


List dependencies and their status 
Remove the given dependencies' files 
Compile dependencies 

Get all out of date dependencies 
Unlock the given dependencies 

Update the given dependencies 


最 常用 的 操作 是 mix deps .get 和 mix deps.update ° 一 旦 获取 了 依赖 程序 2 这 些 程序 会 自 动 
被 编译 好 供 你 使 用 。 关于 deps 操 作 ， 可 以 通过 mix help deps 或 者 Mix.Tasks.Deps 模 块 文档 
阅读 更 多 信息 。 


7.2- 内 部 依赖 


内 部 的 依赖 指 的 是 你 在 同一 个 工程 中 的 某 个 程序 。 


8-Task 模 块 和 通用 TCP 服 务 器 (gen_tcp) 


e Echo 服务 器 
e Tasks 
e Task 的 监督 者 


本 章 我 们 学 习 如 何 使 用 Erlang 的 :gen_tcp 模 块 来 处 理 请 求 。 在 未 来 几 章 中 我 们 还 会 扩展 我 们 
的 服务 器 ， 使 之 能 够 服务 于 申 正 的 命令 。 这 也 是 我 们 探索 Elixir 的 Task 模 块 的 大 好 机 会 。 


8.1-Echo 服 务 器 


我 们 首先 实现 一 个 Echo (回声 ) 服务 器 来 开始 我 们 的 TCP 服 务 器 之 旅 。 它 只 是 简单 地 返回 从 
请 求 中 收 到 的 文字 。 我 们 会 慢 慢 地 改进 这 个 服务 器 ， 使 它 有 监督 者 来 监督 ， 并 且 可 以 处 理 大 
量 连接 。 


一 个 TCP 服 务 器 ， 总 的 来 说 ， 实 现 以 下 几 步 : 


1. 在 可 用 端口 建立 socket 连接 ， 监 听 这 个 端口 
2. 等 待 这 个 端口 的 客户 端 连接 ， pee 
a 


BAT] KK ML 3K LE FE o FE apps/kv_server 程序 中 ， 打 开 文 件 lib/kv_server.ex ， 添 加 以 下 函 
数 : 


def accept(port) do 


# The options below mean: 
H 


# 1. :binary”- receives data as binaries (instead of lists) 
# 2. “packet: :line  - receives data line by line 
# 3. “active: false’ - block on ~:gen_tcp.recv/2~ until data is available 


{:ok, socket} = :gen_tcp.listen(port, 
[:binary, packet: :line, active: false]) 
I0.puts "Accepting connections on port #{port}" 
loop_acceptor (socket) 
end 


defp loop_acceptor(socket) do 
{:ok, client} = :gen_tcp.accept(socket) 
serve(client ) 
loop_acceptor (socket) 

end 


defp serve(client) do 
client 
|> read_line() 
|> write_line(client) 


serve(client ) 
end 


defp read_line(socket) do 
{:ok, data} = :gen_tcp.recv(socket, 0) 
data 

end 


defp write_line(line, socket) do 
:gen_tcp.send(socket, line) 
end 


我 们 通过 调用 kvserver .accept (4040) 来 启动 服务 器 ， 其 中 4040 是 端口 号 。 在 accept/1 中 ， 
第 一 步 是 去 监听 这 个 端口 ， 知 道 socket 变 成 可 用 状态 ， 然 后 调用 loop_acceptor/1 ° $ 

数 loop_acceptor/1 只 是 一 个 循环 ， 来 接受 客户 端的 连接 。 对 于 每 次 接受 的 客户 端 连接 ， 我 们 
调用 serve/1 函数 。 


Hyak serve/1 也 是 个 循环 ， 它 一 次 从 socket 中 读 取 一 行 ， 并 将 其 写 进 给 socket 的 回复 。 


意 serve/1 使 用 了 管道 运算 符 |> 来 表达 操作 流程 。 管 道 运算 符 计 算 左 侧 函 数 计算 的 结果 ， 
并 将 其 作为 第 一 个 参数 传递 给 右 侧 函 数 调用 。 如 : 


socket |> read line() |> write line(socket) 


相当 于 : 


write_line(read_line(socket), socket) 


当 使 用 |> 运算 符 时 ， 是 否 给 函数 调用 加 上 括号 是 很 重要 的 。 举 个 例子 : 
1..10 |> Enum.filter &(&1 <= 5) |> Enum.map &(&1 * 2) 
会 被 翻译 为 : 


1..10 |> Enum,filter(&(&1 <= 5) |> Enum.map(&(&1 * 2))) 


这 个 不 是 我 们 想 要 的 ， 因 为 本 应 传 给 Enum.filter/2 的 那个 匿名 函数 &(&1<=5) 成 了 传 
给 Enum.map/2 的 第 一 个 参数 。 解决 方法 就 是 加 上 括号 : 
1..10 |> Enum.filter(&(&1 <= 5)) |> Enum.map(&(&1 * 2)) 


函数 read_line/2 中 使 用 :gen_tcp.recv/2 接收 从 socket 传 来 的 数据 。 而 write_line/2 中 使 
用 :gen_tcp.send/2 向 Socket 写 入 数据 。 


这 差不多 就 是 我 们 为 实现 这 个 回声 服务 器 所 要 做 的 。 让 我 们 试 一 试 。 
用 iex -S mix 在 kv_server 应 用 程序 中 启动 对 话 ， 执 行 : 


iex> KVServer.accept(4040) 


服务 器 就 运行 了 ， 注 意 到 此 时 该 命令 行 会 被 阻塞 。 现 在 我 们 使 用 一 个 telnet 窜 户 端 来 访问 这 个 
服务 器 。 基 本 上 每 个 操作 系统 都 有 telnet 客 户 端 程序 ， 命 令 也 都 差不多 : 


$ telnet 127.0.0.1 4040 
Trying 127.0.0.1... 
Connected to localhost. 
Escape character is 'A]'. 
hello 

hello 

is it me 

is it me 

you are looking for? 

you are looking for? 


输入 "hello"， 按 回 车 ， 你 就 会 得 到 “hello" 字 样 的 回复 。 好 牛 逼 ! 
退出 telnet 客 户 端 方法 不 一 ， 有 些 用 ctrl + ] ， 有 些 是 quit 按 回 车 。 


一 旦 你 退出 telnet 客 户 端 ， 你 会 发 现 IEXx 会 话 中 打印 出 一 个 错误 信息 : 


** (MatchError) no match of right hand side value: {:error, :closed} 
(kv_server) lib/kv_server.ex:41: KVServer.read_line/1 
(kv_server) lib/kv_server.ex:33: KVServer.serve/1 
(kv_server) lib/kv_server.ex:27: KVServer.loop_acceptor/1 


这 是 因为 我 们 还 期 望 从 :gen_tcp.recv/2 拿 数据 ， 但 是 客户 端 断 了 。 我 们 将 来 要 处 理 这 个 问题 
才 行 。 

目前 还 有 个 更 重要 的 bug 要 修 : 假如 TCP 接 收 者 挂 了 怎么 办 ? 意 为 它 没 有 监督 者 ， 不 会 自己 重 
启 ， 要 是 挂 了 我 们 将 不 能 在 处 理 更 多 的 请 求 。 这 就 是 为 啥 我 们 要 将 它 挪 进 监督 树 。 


8.2-Tasks 


我 们 已 经 学 习 了 Agent， 通 用 服务 器 以 及 事件 管理 器 。 它 们 都 可 以 进行 多 消息 协作 ， 或 者 管理 
状态 。 但 是 ， 若 是 只 需要 处 理 一 些 任务 ， 选 什么 呢 ? 


Task 模 块 为 jain T 。 例 如 ， 它 有 start_link/3 函数 ， 接 受 一 个 模块 名 、 一 个 函 
数 和 函数 的 参数 ， 从 而 执行 这 个 传 入 的 函数 ， 并 且 还 是 作为 监督 树 的 一 部 分 


我 们 来 试 试 。 打 开 1ib/kv_server.ex ， 修 改 下 里 start/2 函数 里 的 监督 者 : 


def start(_type, _args) do 
import Supervisor .Spec 


children = [ 
worker(Task, [KVServer, :accept, [4040]]) 
] 


opts = [strategy: :one_for_one, name: KVServer.Supervisor } 
Supervisor.start_link(children, opts) 
end 


改动 的 意思 是 要 让 kvserver .accept (4040) 成 为 一 个 工人 来 运行 。 目 前 我 们 暂时 hardcode 这 个 
端口 号 ， 之 后 再 讨论 如 何 修改 。 


现在 ， 这 个 服务 器 是 监督 树 的 一 部 分 了 ， 它 应 该 会 随 着 应 用 程序 启动 而 自动 运行 。 在 终端 中 
输入 mix run --no-halt ， 然 后 再 次 用 telnet 客 户 端 来 试 试看 是 否 还 一 切 正 常 : 


$ telnet 127.0.0.1 4040 
Trying 127.0.0.1... 
Connected to localhost. 
Escape character is '^]'. 
say you 

say you 

say me 

say me 


看 ， 它 还 是 好 使 | 这 回 就 算 退 了 客户 端 ， 服务器 挂 了 ， 你 会 看 到 又 一 个 立马 起 来 了 。 嘿 ， 不 
错 。。。 不 过 它 可 伸缩 性 如 何 ? 


试 着 打开 两 个 telnet 客 户 端 一 起 连接 ， 你 会 注意 到 ， 第 二 个 客户 端 根 本 不 能 回声 : 


$ telnet 127.0.0.1 4040 
Trying 127.0.0.1... 
Connected to localhost. 
Escape character is '^]'. 
hello 

hello? 

HELLOOOOOO? 


看 起 来 根本 不 工作 嘛 。 这 是 因为 处 理 请 求 和 接受 请 求 是 在 同一 个 进程 。 一 个 客户 端 连 上 来 ， 
就 没 法 处 理 第 二 个 了 。 


8.3-Task 的 监督 者 


为 了 让 我 们 的 服务 器 能 够 处 理 并 发 连接 ， 我 们 需要 让 一 个 进程 来 当 接收 者 ， 然 后 派生 其 它 的 
进程 来 服务 接收 到 的 连接 。 一 个 方案 是 : 


defp loop_acceptor(socket) do 
{:ok, client} = :gen_tcp.accept(socket) 
serve(client) 
loop_acceptor (socket) 

end 


m3 Task.start_link/1 类 似 Task.start_link/3 ， 但 是 它 可 以 接受 一 个 匿名 有 函数 而 不 是 ( 模 
块 ， 函 数 ， 参 数 ) HAS: 


defp loop_acceptor(socket) do 
{:ok, client} = :gen_tcp.accept(socket) 
Task.start_link(fn -> serve(client) end) 
loop_acceptor (socket) 

end 


我 们 翻 过 这 个 错 了 ， 记 得 吗 ? 
和 我 们 当时 在 注册 表 进 程 中 调用 xv. pucket.start_link/o 犯 的 错 差 不 多 。 它 意味 着 一 个 bucket 
挂 会 导致 整个 注册 表 进 程 挂 。 


上 面 的 代码 页 犯 了 相同 的 错误 : 如 果 我 们 把 serve(client) 这 个 任务 和 接收 者 连接 起 来 ， 那 么 
在 处 理 请 求 时 发 生 的 小 事故 就 会 导致 请 求 接收 者 挂 ， 继 而 导致 连接 都 挂 掉 。 


当时 我 们 解决 这 个 问题 是 用 了 一 个 简单 的 一 对 一 监督 者 。 这 里 我 们 也 将 使 用 相同 的 办 法 ， 除 
了 一 点 : 这 个 模式 在 Task 中 实在 是 太 通 用 了 ， 所 有 Task 已 经 为 之 提供 了 一 个 解决 方案 --- 一 个 
简单 的 一 对 一 监督 者 加 上 临时 工 (临时 的 工人 ) ， 这 个 我 们 在 之 前 的 监督 树 中 就 是 这 么 用 

的 。 


让 我 们 再 次 修改 下 start/2 函数 ， 加 个 监督 者 : 


def start(_type, _args) do 
import Supervisor .Spec 


children = [ 
supervisor(Task.Supervisor, [[name: KVServer.TaskSupervisor]]), 
worker(Task, [KVServer, :accept, [4040]]) 

] 


opts = [strategy: :one_for_one, name: KVServer.Supervisor | 
Supervisor.start_link(children, opts) 
end 


我 们 简单 地 启动 了 一 个 Task.Supervisor #42 > 4 FY task.Supervisor 。 记 住 ， 因 为 接收 者 
任务 依赖 于 这 个 监督 者 ， 因 此 该 监督 者 必须 先 启动 。 


现在 我 们 只 需 修改 loop acceptor/2 ， 使 用 task.Supervisor 来 处 理 每 个 请 求 : 


defp loop_acceptor(socket) do 
{:ok, client} = :gen_tcp.accept(socket) 
Task.Supervisor.start_child(KVServer.TaskSupervisor, fn -> serve(client) end) 
loop_acceptor (socket) 


用 命令 mix run --no-halt 启动 新 的 服务 器 ， 现在 就 可 以 打开 多 个 客户 端 来 连接 了 。 而 且 你 会 
发 现 一 个 客户 端 退出 不 会 让 接收 者 挂 掉 。 好 棒 | 


一 下 是 完整 的 服务 器 实现 ， 在 单个 模块 中 : 


defmodule KVServer do 
use Application 


@doc false 
def start(_type, _args) do 
import Supervisor .Spec 


children = [ 
supervisor(Task.Supervisor, [[name: KVServer.TaskSupervisor]]), 
worker(Task, [KVServer, :accept, [4040]]) 


] 


opts = [strategy: :one_for_one, name: KVServer.Supervisor | 
Supervisor.start_link(children, opts) 
end 


@doc nun 

Starts accepting connections on the given ‘port’. 

def accept(port) do 
{:ok, socket} = :gen_tcp.listen(port, 

[:binary, packet: :line, active: false]) 

I0.puts "Accepting connections on port #{port}" 
loop_acceptor(socket) 

end 


defp loop_acceptor(socket) do 
{:ok, client} = :gen_tcp.accept(socket) 
Task.Supervisor.start_child(KVServer.TaskSupervisor, fn -> serve(client) end) 
loop_acceptor(socket) 

end 


defp serve(socket) do 
socket 
|> read_line() 
|> write_line(socket) 


serve(socket ) 
end 


defp read_line(socket) do 
{:ok, data} = :gen_tcp.recv(socket, 0) 
data 

end 


defp write_line(line, socket) do 
:gen_tcp.send(socket, line) 
end 
end 


因为 我 们 修改 了 监督 者 的 需求 ， 我 们 会 问 : 我 们 的 监督 者 策略 还 适用 吗 ? 


这 里 答案 是 Yes : 如 果 接 收 者 挂 了 ， 现 存 的 连接 是 没 理由 一 起 挂 的 。 另 一 方面 ， 如 果 task 监 督 
者 挂 了 ， 同 样 也 没 必要 让 接收 者 挂 掉 。 这 和 注册 表 进 程 那 种 情况 相反 ， 那 种 情况 我 们 在 一 开 
始 必须 在 注册 表 进 程 挂 掉 时 让 监督 者 也 挂 掉 ， 直 到 后 来 我 们 用 上 了 ETS 来 持久 化 保存 状态 。 
而 task 是 没有 状态 什么 的 ， 挂 掉 一 个 两 个 也 不 会 拖 谁 的 后 腿 。 


下 一 章 我 们 将 开始 解析 客户 请 求 ， 然 后 发 送 回复 ， 从 而 完成 我 们 的 服务 器 。 


9- 文 档 、 测 试 和 管道 


本 章 我 们 将 实现 “解析 "功能 ， 来 解析 在 第 一 章 提 到 的 命令 行 操作 指令 (还 记得 吗 ? 我 们 在 写 一 
个 简易 redis ! ) 

CREATE shopping 

OK 


PUT shopping milk 1 
OK 


PUT shopping eggs 3 
OK 


GET shopping milk 
all 
OK 


DELETE shopping eggs 
OK 


解析 功能 完成 后 ， 我 们 会 把 代码 更 新 到 之 前 创建 的 :kv 程序 里 面 去 。 


文档 测试 (Doctests ) 


Doctest 常 见于 python，ruby 等 语言 ， 是 一 种 基于 代码 注释 文档 书写 单元 测试 的 方法 。 用 
特定 的 语法 为 函数 或 方法 书写 注释 ， 用 doctest 命 令 执 行 这 些 文档 测试 代码 。 
注意 : 为 了 保证 代码 简洁 ， 不 能 完全 用 doctest 代 替 传 统 的 单元 测试 代码 


在 语言 官网 首页 ， 我 们 说 Elixir 视 代码 中 的 文档 标记 为 语言 中 的 一 等 公民 。 在 文档 手册 中 ， 我 
们 也 多 次 涉及 这 个 概念 。 比如 经 常 在 IEXx 命 令 行 中 执行 mix help ， 以 及 输入 h Enum Rh + 
其 他 模块 名 字 。 

本 章 中 ， 我 们 在 实现 上 文 所 说 "解析 "功能 的 时 候 ， 引 入 文档 注释 的 内 容 。 它 能 够 让 我 们 直接 通 
过 代码 的 文档 注释 写 测 试 ， 有 助 于 我 们 在 文档 注释 中 写 出 更 准确 的 sample。 


现在 来 创建 我 们 的 解析 功能 函数 1ib/kv_server/command.ex 。 先 写 doctest : 


defmodule KVServer.Command do 
@doc Satay 
Parses the given `line` into a command. 


## Examples 


iex> KVServer.Command.parse "CREATE shopping\r\n" 
{:ok, {:create, "shopping"}} 


def parse(line) do 
:not_implemented 
end 
end 


Doctests 规 定 的 书写 形式 : 在 4 空格 缩 进 之 后 的 iex> 提示 符 后 。 如 果 一 个 命令 不 止 一 行 ， 则 
在 除 第 一 行 的 其 它 行 用 ...> 代替 iex> 字样 。 命令 的 结果 则 写 在 iex> 或 ...> 的 下 一 行 ， 
后 面 以 一 个 新 行 或 者 下 一 个 新 的 iex> 行 结 


同时 注意 ， 我 们 写 注释 文档 时 用 @doc ~s""" 起 头 。 -s 可 以 保证 文档 里 写 的 /r/n 不 会 在 执行 
doctests 测 试 前 被 转 义 成 回 车 。 


执行 doctets， 我 们 先 创建 一 个 测试 脚本 test/kv_server/command_test.exs ， 在 用 例 中 调 


用 doctest KVServer . Command 


defmodule KVServer.CommandTest do 
use ExUnit.Case, async: true 
doctest KVServer.Command 

end 


10- 分 布 式 任务 及 配置 


在 这 最 后 一 章 中 ， 我 们 将 回 到 :kv 应 用 程序 ， 给 它 添加 一 个 路 由 层 ， 使 之 可 以 根据 桶 的 名 
字 ， 在 各 个 节点 问 分 发 请 求 。 
路 由 层 会 接收 一 个 如 下 形式 的 路 由 表 : 


[{?a..?m, :"foo@computer-name"}, 
{?n..?z, :"bar@computer-name"}] 


路 由 者 (负责 转发 请 求 的 角色 ， 可 能 是 个 节点 ) 将 根据 桶 名 字 的 第 一 个 字 节 查 这 个 路 由 表 ， 
然后 根据 路 由 表 所 示 将 用 户 对 桶 的 请 求 发 给 相应 的 节点 。 上 比如， 根据 上 表 ， 某 个 桶 名 字 第 一 
个 字母 是 “a”( ?a 表示 字母 “a" 的 Unicode 码 ) ， 那 么 对 它 的 请 求 会 被 路 由 

到 foo@computer -name 这 个 节点 去 。 


如 果 节 点 处 理 了 路 由 请 求 ， 那 么 路 由 过 程 结 束 。 如 果 节 点 自己 也 有 个 路 由 表 ， 会 根据 该 路 由 
表 把 请 求 又 转发 给 了 其 它 相应 节点 。 如 果 最 终 没 有 节点 接收 和 处 理 请 求 ， 则 报 出 异常 。 


你 会 问 ， 为 啥 我 们 不 简单 地 命令 路 由 表 中 查 出 来 的 节点 来 直接 处 理 数 据 请 求 ， 而 是 将 路 由 请 
求 传 给 它 ? 当 一 个 路 由 表 像 上 面 那 个 例子 一 样 简单 的 话 ， 这 样 做 比较 简单 。 但 是 ， 考 虑 到 程 
序 的 规模 越 来 越 大 ， 会 将 大 路 由 表 分 解 成 小 块 ， 分 开 存 放 在 不 同 节 点 。 这 种 情况 下 ， 还 是 用 
分 发 路 由 请 求 的 方式 简单 些 。 也 许 在 某 些 时 刻 ， 节点 foo@computer-name 将 只 负责 路 由 请 求 ， 
不 再 处 理 桶 数据 请 求 ， 它 承载 的 桶 都 会 分 给 其 它 节点 。 这 种 方式 ， 节 点 par@computer-name 都 
不 需要 知道 这 个 变化 。 


注意 : 本 章 中 我 们 会 在 同一 人 台 机 器 上 使 用 两 个 节点 。 你 当然 可 以 用 同一 网 络 中 得 不 同 的 
机 器 ， 但 是 这 种 方式 需要 做 一 些 准备 。 首先 你 需要 确保 所 有 的 机 器 上 都 有 一 个 名 

叫 ~/.erlang.cookie 的 文件 。 其 次 ， 你 要 保证 epmd 在 一 个 可 访问 的 端口 运行 (你 可 以 
执行 epmd -d 查看 debug 信 息 来 确定 这 点 ) 。 第 三 ， 如 果 你 想 学 习 更 多 关于 分 布 式 编程 
的 知识 ， 我 们 推荐 这 篇 文章 。 


我 们 最 初版 本 的 分 布 式 代码 


Elixir 内 置 了 连接 节点 及 于 期 间 交 换 信息 的 工具 。 事 实 上 ， 在 一 个 分 布 式 的 环境 中 进行 的 消息 
的 发 送 和 接收 ， 和 之 前 学 习 的 进程 的 内 容 并 无 区 别 : 因为 Elixir 的 进程 是 位 置 透明 的 。 意 思 
是 当 我 们 发 送 消息 的 时 候 ， 它 不 管 请 求 是 在 当前 节点 还 是 在 别 的 节点 ， 诬 拟 机 都 会 传递 消 
É, o 
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为 了 执行 分 布 式 的 代码 ， 我 们 需要 用 某 个 名 字 启 动 虚拟 机 。 名 字 可 以 使 简短 的 ( 当 在 同一 个 
MAA) 或 是 较 长 的 (需要 附 上 计算 机 地 址 ) 。 让 我 们 启动 一 个 新 |Ex 会 话 : 


$ iex --sname foo 


You can see now the prompt is slightly different and shows the node name followed by the 
computer name: 


Interactive Elixir - press Ctrl+C to exit (type h() ENTER for help) 
iex(foo0@jv)1> 


My computer is named jv ,solsee foo@jv in the example above, but you will get a 
different result. We will use jv@computer-name in the following examples and you should 
update them accordingly when trying out the code. 


让 我 们 在 shell 中 定义 一 个 名 叫 Hello 的 模块 : 


iex> defmodule Hello do 
..> def world, do: I10.puts "hello world" 
...> end 


If you have another computer on the same network with both Erlang and Elixir installed, you 
can start another shell on it. If you don't, you can simply start another IEx session in another 
terminal. In either case, give it the short name of bar : 


$ iex --sname bar 


Note that inside this new IEx session, we cannot access Hello.world/® : 


iex> Hello.world 
** (UndefinedFunctionError) undefined function: Hello.world/0 
Hello.world() 


However we can spawn a new process ON foo@computer -name from bar@computer-name ! 
Let's give ita try (where @computer-name is the one you see locally): 


iex> Node.spawn_link :"foo@computer-name", fn -> Hello.world end 
#PID<9014.59.0> 
hello world 


Elixir spawned a process on another node and returned its pid. The code then executed on 
the other node where the Hello.world/oe function exists and invoked that function. Note that 
the result of "hello world" was printed on the current node bar and not on foo . In other 
words, the message to be printed was sent back from foo to bar . This happens because 
the process spawned on the other node ( foo ) still has the group leader of the current node 
( bar ). We have briefly talked about group leaders in the IO chapter. 


We can send and receive message from the pid returned by Node.spawn_link/2 as usual. 
Let's try a quick ping-pong example: 


iex> pid = Node.spawn_link :"foo@computer-name", fn -> 
ae receive do 


ao {:ping, client} -> send client, :pong 
Ae end 
...> end 


#PID<9014.59.0> 

iex> send pid, {:ping, self} 
{:ping, #PID<0.73.0>} 

iex> flush 

:pong 

:Ok 


From our quick exploration, we could conclude that we should simply use 

Node.spawn_link/2 to Spawn processes on a remote node every time we need to do a 
distributed computation. However we have learned throughout this guide that spawning 
processes outside of supervision trees should be avoided if possible, so we need to look for 
other options. 


There are three better alternatives to Node.spawn_link/2 that we could use in our 
implementation: 


1. We could use Erlang's :rpc module to execute functions on a remote node. Inside the 
bar@computer-name shell above, you can call 
:rpc.call(:"foo@computer-name", Hello, :world, []) and it will print "hello world" 


2. We could have a server running on the other node and send requests to that node via 
the GenServer API. For example, you can call a remote named server using 
GenServer.call({name, node}, arg) or simply passing the remote process PID as first 
argument 


3. We could use tasks, which we have learned about in a previous chapter, as they can be 
spawned on both local and remote nodes 


The options above have different properties. Both :rpc and using a GenServer would 
serialize your requests on a single server, while tasks are effectively running asynchronously 
on the remote node, with the only serialization point being the spawning done by the 
supervisor. 


For our routing layer, we are going to use tasks, but feel free to explore the other alternatives 
too. 


async/await 


So far we have explored tasks that are started and run in isolation, with no regard for their 
return value. However, sometimes it is useful to run a task to compute a value and read its 
result later on. For this, tasks also provide the async/await pattern: 


task = Task.async(fn -> compute_something_expensive end) 
res compute_something_else() 
res + Task.await(task) 


async/await provides a very simple mechanism to compute values concurrently. Not only 
that, async/await can also be used with the same Task.Supervisor we have used in 
previous chapters. We just need to call Task.Supervisor.async/2 instead of 
Task.Supervisor.start_child/2 and use Task.await/2 to read the result later on. 


Distributed tasks 


Distributed tasks are exactly the same as supervised tasks. The only difference is that we 
pass the node name when spawning the task on the supervisor. Open up 
lib/kv/supervisor.ex fromthe :kv application. Let's add a task supervisor to the tree: 


supervisor(Task.Supervisor, [[name: KV.RouterTasks]]), 


Now, let's start two named nodes again, but inside the :kv application: 


$ iex --sname foo -S mix 
$ iex --sname bar -S mix 


From inside bar@computer-name , we Can now spawn a task directly on the other node via the 
supervisor: 


iex> task = Task.Supervisor.async {KV.RouterTasks, :"foo@computer-name"}, fn -> 
> {:ok, node()} 
...> end 


%Task{pid: #PID<12467.88.0>, ref: #Reference<0.0.0.400>} 
iex> Task.await(task) 
{:ok, :"foo@computer-name"} 


Our first distributed task is straightforward: it simply gets the name of the node the task is 
running on. With this knowledge in hand, let's finally write the routing code. 


路 由 层 


Create a file at lib/kv/router.ex with the following contents: 


defmodule KV.Router do 
@doc nun 
Dispatch the given mod, fun, args request 
to the appropriate node based on the “bucket. 
def route(bucket, mod, fun, args) do 
# Get the first byte of the binary 
first = :binary.first(bucket) 


# Try to find an entry in the table or raise 
entry = 
Enum.find(table, fn {enum, node} -> 
first in enum 
end) || no_entry_error(bucket) 


# If the entry node is the current node 

if elem(entry, 1) == node() do 
apply(mod, fun, args) 

else 
sup = {KV.RouterTasks, elem(entry, 1)} 
Task.Supervisor.async(sup, fn -> 

KV.Router.route(bucket, mod, fun, args) 

end) |> Task.await() 

end 

end 


defp no_entry_error(bucket) do 
raise "could not find entry for #{inspect bucket} in table #{inspect table}" 
end 


@doc nun 
The routing table. 
def table do 
# Replace computer-name with your local machine name. 
[{?a..?m, :"foo@computer-name"}, 
{?n..?z, :"bar@computer-name"}] 
end 
end 


Let's write a test to verify our router works. Create a file named test/kv/router_test.exs 
containing: 


defmodule KV.RouterTest do 
use ExUnit.Case, async: true 


test "route requests across nodes" do 
assert KV.Router.route("hello", Kernel, :node, []) == 
:'"foo@computer -name" 
assert KV.Router.route("world", Kernel, :node, []) == 
:"bar@computer -name" 
end 


test "raises on unknown entries" do 
assert_raise RuntimeError, ~r/could not find entry/, fn -> 
KV.Router.route(<<0>>, Kernel, :node, []) 
end 
end 
end 


The first test simply invokes Kernel.node/o , which returns the name of the current node, 
based on the bucket names "hello" and "world". According to our routing table so far, we 
should get foo@computer-name and bar@computer-name as responses, respectively. 


The second test just checks that the code raises for unknown entries. 


In order to run the first test, we need to have two nodes running. Let's restart the node 
named par , which is going to be used by tests. This time we'll need to run the node in the 

test environment, to ensure the compiled code being run is exactly the same as that used 
in the tests themselves: 


$ MIX_ENV=test iex --Sname bar -S mix 


And now run tests with: 


$ elixir --sname foo -S mix test 


Our test should successfully pass. Excellent! 


Test filters and tags 


Although our tests pass, our testing structure is getting more complex. In particular, running 
tests with only mix test causes failures in our suite, since our test requires a connection to 
another node. 


Luckily, ExUnit ships with a facility to tag tests, allowing us to run specific callbacks or even 
filter tests altogether based on those tags. 


All we need to do to tag a test is simply call @tag before the test name. Back to 


test/kv/router_test.exs , let's adda :distributed tag: 


@tag :distributed 
test "route requests across nodes" do 


Writing @tag :distributed is equivalent to writing @tag distributed: true . 


With the test properly tagged, we can now check if the node is alive on the network and, if 
not, we can exclude all distributed tests. Open up test/test_helper.exs inside the :kv 
application and add the following: 


exclude = 
if Node.alive?, do: [], else: [distributed: true] 


ExUnit.start(exclude: exclude) 


Now run tests with mix test : 


$ mix test 
Excluding tags: [distributed: true] 


Finished in 0.1 seconds (0.1s on load, 0.01s on tests) 
7 tests, © failures 


This time all tests passed and ExUnit warned us that distributed tests were being excluded. 
If you run tests with $ elixir --sname foo -S mix test , one extra test should run and 
successfully pass as long as the bar@computer-name node is available. 


The mix test command also allows us to dynamically include and exclude tags. For 
example, we can run $ mix test --include distributed to run distributed tests regardless of 
the value setin test/test_helper.exs . We could also pass --exclude to exclude a 
particular tag from the command line. Finally, --only can be used to run only tests with a 
particular tag: 


$ elixir --sname foo -S mix test --only distributed 


You can read more about filters, tags and the default tags in Exunit.case module 
documentation. 


Application environment and configuration 


So far we have hardcoded the routing table into the kv.Router module. However, we would 
like to make the table dynamic. This allows us not only to configure 
development/test/production, but also to allow different nodes to run with different entries in 
the routing table. There is a feature of OTP that does exactly that: the application 
environment. 


Each application has an environment that stores the application's specific configuration by 
key. For example, we could store the routing table in the :kv application environment, 
giving it a default value and allowing other applications to change the table as needed. 


Open up apps/kv/mix.exs and change the application/o function to return the following: 


def application do 
[applications: [], 
env: [routing_table: []], 
mod: {KV, []}] 

end 


We have added anew :env key to the application. It returns the application default 
environment, which has an entry of key :routing_table and value of an empty list. It makes 
sense for the application environment to ship with an empty table, as the specific routing 
table depends on the testing/deployment structure. 


In order to use the application environment in our code, we just need to replace 
KV.Router.table/o with the definition below: 


@doc The 
The routing table. 


def table do 
Application.get_env(:kv, :routing_table) 
end 


We use Application.get_env/2 to read the entry for :routing_table in :kv 's environment. 
You can find more information and other functions to manipulate the app environment in the 
Application module. 


Since our routing table is now empty, our distributed test should fail. Restart the apps and re- 
run tests to see the failure: 


$ iex --sname bar -S mix 
$ elixir --sname foo -S mix test --only distributed 


The interesting thing about the application environment is that it can be configured not only 
for the current application, but for all applications. Such configuration is done by the 

config/config.exs file. For example, we can configure IEx default prompt to another value. 
Just open apps/kv/config/config.exs and add the following to the end: 


config :iex, default_prompt: ">>>" 


Start IEx with iex -s mix and you can see that the IEx prompt has changed. 


This means we can configure our :routing_table directly in the config/config.exs file as 
well: 


config :kv, :routing_table, 
[{?a..?m, :"foo@computer-name"}, 
{?n..?zZ, :"bar@computer -name"}] 


Restart the nodes and run distributed tests again. Now they should all pass. 


Each application has its own config/config.exs file and they are not shared in any way. 
Configuration can also be set per environment. Read the contents of the config file for the 
:kv application for more information on how to do so. 


Since config files are not shared, if you run tests from the umbrella root, they will fail 
because the configuration we just added to :kv is not available there. However, if you open 
up config/config.exs in the umbrella, it has instructions on how to import config files from 
children applications. You just need to invoke: 


import_config "../apps/kv/config/config.exs" 


The mix run command also accepts a --config flag, which allows configuration files to be 
given on demand. This could be used to start different nodes, each with its own specific 
configuration (for example, different routing tables). 


Overall, the built-in ability to configure applications and the fact that we have built our 
software as an umbrella application gives us plenty of options when deploying the software. 
We can: 


e deploy the umbrella application to a node that will work as both TCP server and key- 
value storage 


e deploy the :kv_server application to work only as a TCP server as long as the routing 
table points only to other nodes 


e deploy only the :kv application when we want a node to work only as storage (no TCP 
access) 


As we add more applications in the future, we can continue controlling our deploy with the 
same level of granularity, cherry-picking which applications with which configuration are 
going to production. We can also consider building multiple releases with a tool like exrm, 
which will package the chosen applications and configuration, including the current Erlang 
and Elixir installations, so we can deploy the application even if the runtime is not pre- 
installed on the target system. 


Finally, we have learned some new things in this chapter, and they could be applied to the 
:kv_server application as well. We are going to leave the next steps as an exercise: 


e change the :kv_server application to read the port from its application environment 
instead of using the hardcoded value of 4040 


e change and configure the :kv_server application to use the routing functionality 
instead of dispatching directly to the local kv.Registry . For :kv_server tests, you can 
make the routing table simply point to the current node itself 


-2 
总 结 
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一 章 我 们 创建 了 一 a eee 并 通过 它 探索 了 Elixir 以 及 Erlang 虚 拟 机 的 分 布 式 特性 
闫 习 了 如 何 配 置 路 由 表 。 这 是 《Elixir 高 级 编程 手册 (Mix 和 OTP) 》 的 最 后 一 章 。 
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通过 这 本 手册 ， 我 们 编写 了 一 个 非常 简单 的 分 布 式 键 - 值 存 储 程序 ， 领 略 了 许多 重要 概念 ， 如 
通用 服务 器 、 事 件 管理 者 、 监 督 者 、 任 务 、 代 理 、 应 用 程序 等 等 。 不 仅 如 此 ， 我 们 还 为 整个 
程序 写 了 测试 代码 ， 就 悉 了 ExUnit， 还 学 习 了 如 何 使 用 Mix 构 建 工具 来 完成 许 许 多 多 的 工作 。 


如 果 你 要 找 一 个 生成 环境 能 用 的 分 布 式 键 - 值 存储 ， 你 一 定 要 去 看 看 Riak， 它 也 运行 于 Erlang 
VM 之 上 。Riak 中 ， 桶 是 有 宛 余 的 ， 以 防止 数据 丢失 。 另 外 ， 它 用 相 容 哈 希 (consistent 
hashing) 而 不 是 路 由 机 制 来 匹配 桶 和 节点 。 因 为 相 容 哈 希 算 法 可 以 减少 因为 桶 名 冲突 而 导致 
的 不 得 不 将 桶 迁移 到 新 节点 的 开销 。 


